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PROCED^; DE DISSOCIATION DE LA MOLECULE D'H^MOGLOBINE 
EXTRACELLULAIRE WARENICOLA MARINA, CARACTERISATION DES 
CHAlNES PR0TM:IQUES CONSTTTUANT LADITE M0L^:GULE ET DES 
S^IQUENCES NUCL^:OTIDIQUES CODANT POUR LESDITES CHAInES 
PROTEIQUES 

La pr6sente invention a pour objet un procede de dissociation de la molecule 
d'hemoglobine extracellulaire d'Annelides, notamment d'Arenicola marina, ainsi que la 
caracterisation des chaines proteiques constituant ladite molecule. 

La presente invention a egalement pour objet la caracterisation des sequences 
nucleotidiques codant pour les chaines proteiques susmentionn6es, ainsi que le procede 
de preparation de ces sequences nucleotidiques. 

Le sang est un liquide complexe dont la fonction principale est de transporter 
Toxygene et le gaz carbonique, afin d'assurer les processus respiratoires. C'est la 
molecule d'hemoglobine, que Ton trouve dans les hematics, qui assure cette fonction. 

La molecule d'hemoglobine de mammifere est formee par I'assemblage de quatre 
chaines polypeptidiques fonctionnelles semblables deux a deux (2 chaines de globine de 
type a et 2 chaines de globine de type p). Chacune de ces chaines polypeptidiques 
possede la meme structuire tertiaire d*une molecule de myoglobine (Dickerson et Geis, 
1983). 

L'heme, site actif de Phemoglobine, est uh anneau protoporphyrinique 
tetrapyrrolique, contenant en son centre un unique atome de fer. L'atome de fer, fixateur 
de Toxygene, etabht 6 liaisons de coordinence : quatre avec les atomes d'azote de la 
porphyrine, une avec Thistidine proximale F8 et une avec la mol6cule d'oxygene lors de 
I'oxygdnation de la globine. 

On est actuellement confront^ aux problemes d'approvisionnement de sang, dus a 
la diminution des dons du sang par peur de contamination. Ainsi, la recherche de 
substituts sanguins s'est accel6ree au cours des demieres annees. On cherche a 
concevoir des substituts sanguins artificiels capables d*eliminer les risques de 
transmission de maladies infectieuses, mais egalement a s'afjfranchir des problemes de 
compatibility des groupes sanguins. 



BEST AVAILABLE COPY 



wo 2005/037392 PCT/FR2004/002602 

2 

Jusqu'a present, les piincipales voies de recherche concement la synthese de 
produits chimiques d'lme part (Clark et Gollan, 1966) et la synthese de produits 
biologiques d'autrepart (Chang, 1957 ; Chang, 1964). 

En ce qui conceme la premiere voie de recherche, on a utilise les 
perfluorocarfoones (PFC). Les PFC sont des produits chimiques capables de transporter 
Toxygene et ils peuvent dissoudre une grande quantite de gaz, comme Toxygdne et le 
dioxyde de carbone. 

Actuellement, on essaye de produire des emulsions de ces produits qui pourraient 
etre disperses dans le sang d'une fa9on plus eflScace (Reiss, 1991 ; Reiss, 1994 ; Goodin 
etal., 1994). 

L'avantage des PFC demeure dans leur capacite oxyphorique directement 
proportionnelle a la quantite d'oxygene se trouvant dans les poumons. Par ailleurs, en 
raison de Tabsence de membrane a traverser, les PFC peuvent transporter I'oxygene 
plus rapidement vers les tissus. Toutefois, on ne connait pas les effets a long ternie de la 
retention de ces produits dans I'organisme. Lorsque ces produits ont ete utilises pour la 
premiere fois comme substitut sanguin dans les annees 1960 chez la souris (Clark et 
Gollan, 1966 ; Geyer et al., 1966 ; Sloviter et Kamimoto, 1967), les effets secondaires 
ont ete tres importants. Les PFC n'etaient pas elimines de la circulation d'une fa9on 
satisfaisante et s'accumulaient dans les tissus de Torgwisme, ce qui provoquait des 
oed^mes. 

Dans les annees 1980, on a teste une nouvelle version de PFC en phase clinique. 
Mais les problemes de stockage, de colit financier, d 'effets secondaires non negligeables 
et la faible efficacite de ce compost ont emp&ch6 Textension de sa commercialisation 
(Naito, 1978 ; Mitsuno etNaito, 1979 ; Mitsuno et Ohyanagi, 1985). 

Recemment, on a mis au point une nouvelle gen6ration de PFC (PFBO 
perfluorooctylbromide). Un nouveau produit (Reiss, 1991) est en cours de test clinique 
aux Etats-Unis, mais on a deja constats qu'une augmentation de la quantity d*oxyg&ne 
dans le sang peut engendrer une accumulation d'oxygene dans les tissus, ce qui est 
dangereux pour Torganisme (formation d'oxygene radicalaire de type superoxyde). 

Ainsi, malgre les progres realises au fiir et i mesure, les effets secondaires de ces 
composes sont encore trop importants pour 6tre commercialises a grande echelle. 

En ce qui conceme la deuxi^me voie de recherche, des chercheurs ont travaille sur 
la mise au point de substituts sanguins en modifiant la structure de Th^moglobine 
naturelle (Chang, 1957 ; Chang, 1997). Pour obtenir un substitut sanguin de type 
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hemoglobine modifide, on utilise des hemoglobines synthetis6es par des 
microorganismes gen^tiquement modifies, ou d'origine humaine ou animale, 
notamment la molecule d'hemoglobine bovine. En effet, Themoglobine bovine est 
16g6rement diffiSrente de Th^moglobine humaine sur le plan immunologique, mais elle 
transporte plus facilement Toxygene vers les tissus. N6anmoins, le risque de 
contamination virale ou de type encephalopathie spongiforme reste toujours important. 

Poiu- etre fonctioraielle, rhemoglobine doit etre en contact avec un effecteur 
allosterique le 2,3-diphosphoglycerate {2,3-DPG), present uniquement a Tinterieur des 
globules rouges (Dickerson et Geis, 1983). De plus, sans le 2,3-DPG et d'autres 
elements presents dans les globules rouges comme la methemoglobine reductase, 
rh6moglobine subit un processus d'auto-oxydation et perd sa capacitc a transporter de 
I'oxygene ou du dioxyde de carbone. 

On peut eliminer ces processus en modifiant la structure de Themoglobine, et plus 
precisement en stabilisant les liaisons faibles de la molecule tetramerique entre les deux 
dimeres a et P (Chang, 1971). De nombreuses modifications ont ete testees : liaison 
covalente entre deux chaines a, entre deux chalnes p ou encore entre a et p (Payne, 
1973 ; Bunn et Jandl, 1968). 

On a 6galement tent6 de polymeriser les molecules tetrameriques ou de les 
conjuguer avec im polymere nomme polyethylene glycol (PEG)(Nho et al., 1992). Ces 
modifications ont pour consequence de stabiliser la molecule et d'augmenter sa taille. 
empechant son Elimination par les reins. 

On a beaucoup etudi6 les Ann61ides pour leur hemoglobine extracellulaire 
(Terwilliger, 1992 ; Lamy et al., 1996). Ces molecules d'h6moglobine extracellulaire 
sont pr6sentes chez les trois classes d*AnneIides : Polych^tes, Oligoch^tes et Achetes et 
meme chez les Vestimentif&res. Ce sont des biopolymferes geants, constitues d* environ 
200 chaines polypeptidiques appartenant a 6 ou 8 types diff&rents que Ton regroupe 
generalement en deux categories. La premiere cat6gorie, comptant 144 a 192 616ments, 
regroupe les chaines polypeptidiques dites "fonctionnelles" portant un site actif et 
capables de lier reversiblement Toxygene ; ce sont des chaines de type globine dont les 
masses sont comprises entre 15 et 18 kDa et qui sont trfes similaires aux chaines de type 
a et P de vertebres. La deuxieme categoric, comptant 36 a 42 elements, regroupe les 
chaines polypeptidiques dites de "structxu-e" possedant peu ou pas de site actif mais 
permettant Tassemblage des douziemes. 
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Les premieres images obtenues sur des hemoglobines extracellulaires d*Arenicole 
(Roche et al., 1960) ont r6v61e des structures hexagonales. Chaque molecule 
d'hemoglobine est constituee de deux hexagones superposes (Levin, 1963 ; Roche, 
1965) que Ton dit en "bicouche hexagonale" (hexagonal bilayer) et chaque hexagone est 
lui-meme fonn6 par Tassemblage de six elements en forme de goutte d'eau (Van 
Bruggen et Weber, 1974 ; Kapp et Crewe, 1984), nommes structure globulaire creuse 
(hollow globular structure)(De Haas et al., 1996) ou "douzieme". La molecule native est 
formee de douze de ces sous-unites, d'une masse moleculaire d*environ 250 kDa. 

Ainsi, le brevet fran9ais n°2 809 624 conceme Tutilisation comme substitut 
sanguin d*hemoglobine extracellulaire d'Arenicola marina^ un Annehde Polych^te de 
Tecosysteme intertidal, ledit substitut sanguin permettant d'eliminer les problfemes de 
penurie de dons. 

Bien que rarchitectxire globale de Themoglobine de Arenicola marina soit 
connue, notamment grace a son etude quatemaire fine par spectrometrie de masse (Zal 
et al., 1997), les sequences primaires des differentes. chaines proteiques qui la 
composent ne le sont pas. 

Ainsi, la presente invention a pour but de foumir les sequences proteiques qui 
composent la mol6cule d'hemoglobine Arenicola marina. 

Un autre but de la presente invention consiste k foumir les premieres etapes de la 
synthese in vitro d'hemoglobine extracellulaire Arenicola marina afin d*61aborer un 
substitut sanguin au moyen de precedes de biochimie et de biologie moleculaire. 

Un autre but de la presente invention consiste a foumir im procede de preparation 
de la molecule d'hemoglobine, eventuellement simplifiee, par genie genetique, et ce 
afin notamment d'augmenter le stock de cette molecule dans le cadre d'une utilisation 
comme substitut sanguin. 

La presente invention conceme un proced6 de dissociation de la molecule 
d'hemoglobine extracellulaire d'Annelides, notamment d' Arenicola marina, permettant 
I'obtention des chaines proteiques constituant ladite molecule, 

ledit procede etant caracterise en ce qu*il comprend une etape de mise en presence 
d'un echantillon d'hemoglobine extracellulaire d*Ann61ides, notamment d'Arenicola 
marina avec au moiris un agent dissociant, notamment un melange constitue de 
dithiothreitol (DTT) ou de chlorhydrate de tris(2-caiboxyethyl)phosphine (tCEP) ou de 
beta-mercapto6thanol et d'un tampon de dissociation, pendant un temps sufHsant pour 
separer les chaines proteiques les unes des autres. 
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La pr6sente invention conceme un proced6 d*obtention des chaines protdiques 
constituant la molecule d'h6moglobine extracellulaire d'Ann61ides, notamment 
d'Arenicola marina^ 

ledit procedd 6tant caracterise en ce qu'il comprend une etape de mise en presence 
d'un echantillon d*hemoglobine extracellulaire d*Annelides, notamment d^Arenicola 
marina avec au moins un agent dissociant, et le cas echeant un agent r6ducteur, 
notamment un melange constitue de dithiothreitol (DTT) ou de chlorhydrate de tris(2- 
carboxyethyl)phosphine (TCEP) ou de bSta-mercaptoethanol et d'un tampon de 
dissociation, pendant un temps suffisant pour separer les chaines proteiques les unes des 
autres. 

Par "hemoglobine extracellulaire", on designe une hemoglobine non contenue 
dans les cellules et dissoute dans le sang. 

L* expression "dissociation" designe un traitement chimique capable de rompre les 
interactions faibles (hydrophobes, electrostatiques, hydrogenes...). 

Par "tampon de dissociation", on designe un liquide contenant un tampon 
permettant d'ajuster le pH et contenant des agents dissociants. 

L'expression "agent dissociant" designe un compose chimique capable de rompre 
les interactions faibles (hydrophobes, electrostatiques, hydrogenes...). Ledit agent 
dissociant est notamment choisi parmi : les ions hydroxydes, I'uree ou des ions 
heteropolytungstates ou des sels de guanidinium ou du SDS (sodium dodecyl sulfate). 

L'expression "reduction" designe un traitement chimique capable de rompre les 
interactions fortes telles que les ponts disulfures. 

L'expression "agent reducteur" designe un compose chimique capable de rompre 
les interactions fortes telles que les ponts disulfures. 

Les dix chaines proteiques constituant la molecule d 'hemoglobine extracellulaire 
d'Arenicola marina comprennent 8 chaines de type globine et 2 chaines de. type 
structure. 

On rappelle que Themoglobine extracellulaire de Arenicola marina d'une masse 
de 3648 db 24 kDa est constitute de 198 chaines polypeptidiques appartenant a 10 types , 
differents regroupes en deux categories : 

- la premiere (156 chaines) regroupe des chaines polypeptidiques dites 
"fonctionnelles" portant im site actif capable de lier reversiblement Toxygfene ; ce sont 
des chaines de type globine dont les masses sont comprises entre 15 et 18 kDa; ces 
chaines sont tres similaires aux chaines de types a et P des vertebres ; et 
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- la deuxieme (42 chalnes) regroupe des chaines polypqjtidiques dites de 
"structure" (ou "linker") poss6dant peu ou pas de site actif mais permettant T assemblage 
des dod6cam6res ; ces chaines ont des masses mol6culaires comprises entre 22 et 27 
kDa. 

La presente invention conceme un procede de dissociation de la molecule 
d*hemoglobine extracellulaire d'Arenicola marina, permettant Tobtention des chaines 
proteiques constituant ladite molecule, 

ledit procede etant caracteris6 en ce qu'il comprend une 6tape de mise en presence 
d*un 6chantillon d*hemoglobine extracellulaire d'Arenicola marina avec nn melange 
constitu6 de dithiothr6itol (DTT) et d'un tampon de dissociation, pendant environ une 
heure a trois semaines. 

Un procede de dissociation avantageux de I'invention est caracterise en ce que le 
tampon de dissociation comprend un agent tamponnant k une concentration comprise 
d'environ 0,05 M a environ 0,1 M, notamment du Trisma 
(tris[hydroxymethyl]aminomethane), de I'hepes, du phosphate de sodium, du borate de 
sodium, du bicarbonate d'ammonium ou de I'acetate d'ammonium, et 0 a 10 mM 
d'EDTA ajuste a un pH compris d'environ 5 a environ 12, et de preference d'environ 
7,5 a 12, le tout etant notamment ajuste a un pH compris d'environ 2 a 12, et de 
preference d* environ 5 a 12. 

De preference, ledit tampon^ de dissociation comprend de TEDTA a une 
concentration d'environ 1 mM ajuste a un pH d'environ 10, notamment avec une 
solution de sonde 2N. 

Selon un mode de realisation avantageux, le proced6 de I'invention est caracterise 
en ce que les chaines proteiques constituant ladite molecule sont obtenues par la 
reduction de quatre sous-unit6s par un agent r6ducteur, par exemple en presence de 
DTT, lesdites sous-unites 6tant elles-m&mes obtenues par mise en presence d'un 
echantillon d'hemoglobine extracellulaire d*Arenicola marina avec diflferents agents 
dissociants, notamment un tampon de dissociation. 

La molecule native se dissocie en sous-unites sous Taction d'agents dissociants 
non r6ducteurs. II n'y a done pas rupture des liaisons covalentes. Toutefois, aprte 
Taction d'un agent reducteur (coupxure des liaisons covalentes), les sous-unites sont 
r6duites en chaines polypeptidiques (chaines prot6iques constituees de T assemblage 
d'acides amines). 
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Les 4 sous-unites susmentionnees sont done : les monomeres, les dimeres, les 
trimeres et les dod6cam&res. 

Les monomdres sont des chaines de globine. 

Les dimeres sous forme homo et heterodimferes sont des chaines de structure. 

Les trimeres sont des assemblages covalents de trois chaines de globine. 

Les dodecameres sont constitues de 12 chaines proteiques ; par exemple : 
3 trimeres + 3 monomeres, 2 trimferes + 6 monomeres, 1 trimere + 9 monomeres. 

On pent done obtenir les chaines proteiques soit en ime seule etape par reduction 
directe de Th^moglobine extracellulaire d'Arenicola marina, soit en deux etapes, Time 
consistant en la dissociation de Thfimoglobine extracellulaire A'Arenicola marina en 4 
sous-unites et Tautre en la reduction desdites 4 sous-unites en chaines proteiques. 

La presente invention concerne egalement un procede de dissociation tel que 
defini ci-dessus, caracterise en ce que les agents dissociants utilises pour obtenir les 4 
sous-unites susmentionnees sont les suivants : 

- une solution tampon de dissociation comprenant : 0,1 M de base Trisma 
(tris[hydroxym6thyl]aminomethane) et 0 a 10 mM d'EDTA ajuste a un pH 
compris d'environ 5 a environ .12, et de preference d'environ 7,5 a environ 12, et 

- une solution d'uree dont la concentration est comprise d'environ 0,1 M a 
environ 8 M, et est notamment egale a 3 M. 

La presente invention concerne egalement un precede de dissociation tel que 
defini ci-dessus, caract6rise en ce que les agents dissociants pour obtenir les 4 sous- 
unites sont les suivants : 

- une solution tampon de dissociation comprenant 0,1 M de base Trisma et 1 
mM d'EDTA ajuste a pH 10, et 

- 3 M d'uree. 

La presente invention eonceme 6galement un procede de dissociation et DE 
reduction tel que defini ci-dessus, caract6ris6 en ce que les agents dissociants et 
reducteurs utilises pour obtenir les chaines proteiques sont les suivants : 

- une solution tampon de dissociation comprenant : 0,1 M de base Trisma 
(tris[hydroxymethyl]aniinomethane) a un pH compris d^environ 8 k environ 9, et 

- une solution d'ur6e dont la concentration est comprise d'environ 4 M a environ 
8 M, et est notamment 6gale i 8 M, et 

- 1 ilO%DTT 
ou 
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- une solution tampon de dissociation comprenant : 0,1 M de bicarbonate 
d'anunonium i un pH compris d'environ 8 k environ 9, et 

^ lalO%DTT 

Le procede de dissociation et de reduction de I'invention permet d'obtenir une 
composition contenant le melange des chaines proteiques constituant la molecule 
d'hemoglobine extracellulaire d*Arenicola marina. 

La pr6sente invention conceme egalement un procede de preparation de couples 
d'amorces a partir des chaines prot6iques telles qu'obtenues selon le procede tel que 
defini ci-dessus, ledit procede etant caract6ris6 en ce qu'il comprend les etapes 
suivantes : 

- risolement de chacune des chaines proteiques constituant la molecule 
d'hemoglobine telles qu'obtenues selon le procede tel que defini ci-dessus, 

- le microsequenfage de chacune des chaines proteiques isolees susmentionnees 
par spectrometrie de masse et sequen9age d'Edman, afin d'obtenir une microsequence 
conrespondant a chacune des sequences constituees de 5 a 20 acides amines, et 

~ la determination des amorces degenerees a partir des microsequences 
susmentionnees. 

La premiere etape dMsolement des chaines proteiques est notamment effectuee par 
chromatographic liquide en phase inverse et gel bidimensionnel a partir du melange 
susmentionne comprenant les chaines proteiques constituant la molecule d'hemoglobine 
telles qu'obtenues selon le procede de dissociation et de reduction de Tinvention. 

L'expression "microsequence" designe des fragments de sequences proteiques. 

Les microsequences susmentionnes peuvent provenir k la fois des extremites C- et 
N-temunales mais aussi de sequences intemes. 

Les chaines proteiques peuvent etre obtenues par chromatographie liquide en 
phase inverse ou a partir de gel 2D a partir d'hemoglobine purifiee d'Arenicola marina, 
Chaque pic ou tache a ete decoup6 et digSre par une protease. Les peptides ainsi obtenus 
ont 6X6 extraits des gels et separes par capLC (chromatographie liquide capillaire). Les 
fragments sont ensuite analyses par spectrometrie de masse. D'autre part, chaque pic 
isole par phase inverse a 6x6 analyse par s6quen9age d'Edman. 

L'expression "amorces deg6ner6es" designe des sequences nucleotidiques 
obtenues a partir de fragments de sequences proteiques. On parle d'amorces ddgenerees 
en raison de la d6g6nerescence du code genetique (plusieurs codons pour 1 acide 
amind). 
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La demiere etape de determination des couples d' amorces d6generees correspond 
k leur synthase. 

Cette etape permet d'obtenir a la fois des amorces sens et des amorces antisens. 
La pr6sente invention conceme egalement des couples d'amorces tels qu'obtenus 
selon le proced6 tel que d^fini ci-dessus, lesdits couples 6tant notanmient les suivants : 

a) Amorce sens : GAR TGY GGN CCN TTR CAR CG (SEQIDN0:21) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

b) Amorce sens : tgy GGN ath CTN car CG (SEQ ID NO : 23) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

c) Amorce sens : AAR GTI AAR CAN AAC TGG (SEQ ID NO : 24) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ED NO : 22) 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG (SEQ ED NO : 25) 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ BD NO : 22) 

^) Amorce sens : AAR. GTN ATH TTY GGN AGR GA (SEQ BD NO: 26) 

Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ED NO : 22) 

f) Amorce sens : GAR CAY CAR TGY GGN GGN GA (SEQ ED NO : 27) 

Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22) 

oil : 

R represente A ou G, 
Y repr6sente C ou T, 
N repr6sente A, G, C ou T, 
I represente Tinosine, 
H represente A, C ou T. 

La presente invention conceme 6galement des couples d'amorces tels qu'obtenus 
selon le procede tel que defini ci-dessus, lesdits couples etant notamment les suivants : 
Bl) Amorce sens : GAR TGY GGN CCN TTR CAR CG SEQ ID NO: 21 

Amorce antisens : CCA NGC NTC YTT RTC RAA GCA SEQ ID NO : 28 
h) Amorce sens \ AN TGY GGN CCN CTN CAR CG SEQ BD NO : 29 

Amorce antisens : CCA NGC NTC YTT RTC RAA GCA SEQ BD NO : 28 
o) Amorce sens : AAR GTI AAR CAN AAC TGG SEQ BD NO : 24 

Amorce antisens : CCA NGC NCC DAT RTC RAA SEQ BD NO : 30 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG SEQ BD NO : 25 

Amorce antisens : CA NGC NYC RCT RTT RAA RCA SEQ ID NO: 31 
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oil: 

R represente A ou G, 
Y represente C ou T, 
N represente A, G, C ou T, 
I represente rinosine, 
D represente A, G ou T, 
H represente A, C ou T. 

La presente invention conceme egalement un procede de preparation de sequences 
nucleotidiques codant pour les chaines proteiques constituant la molecule 
d'hemoglobine d'Arenicola marinay a partir des amorces telles qu'obtenues selon le 
procede tel que defini ci-dessus, ledit procede etant caracterise en ce qu'il correspond a 
un procede d' amplification en chaine par polymerase (PGR), comprenant une repetition 
d'au moins 30 fois du cycle constitue par les Stapes suivantes : 

* la denaturation, par chauffage, de TADNc monocatenaire codant pour une 
des chaines proteiques constituant la molecule d'hemoglobine d*Aremcola 
marina^ de fa9on a d^naturer d'eventuelles structures secondaires et des reliquats 
d'ARN, ledit ADNc etant obtenu a partir d'ARNm, cette etape permettant 
d'obtenir des brins d'ADNc monocat6naires denatures, 

* rhybridation des couples d*amorces tels qu'obtenus par le procede tel que 
defini ci-dessus aux brins d'ADNc monocat6naires denatures susmentionnes a une 
temperature adequate, pour obtenir des amorces hybridees, et 

* la synthfese du brin compiementaire de TADNc par une polymerase k une 
temperature adequate, k partir des amorces hybridees telles qu'obtenues k Tetape 
precedente. 

L'ADNc codant pour les chaines proteiques susmentionnees est obtenu a partir 
d'ARNm, ledit ARNm etant obtenu par purification k partir d'ARN totaux extraits sur 
des Arenicoles juveniles en pleine croissance, lesdits Arenicoles juveniles presentant un 
taux eiev6 de transcription des differents ARN messagers. 

Si le cycle susmentioime est repete moins de 30 fois, ramplification de I'ADN est 
reduite. 

L'expression "eventuelles structures secondaires" designe des appariements 
anarchiques entre deux sequences d' ADNc. 
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L'expression "d^naturation par chaufifage de TADNc" designe la rupture des 
appariements anarchiques entre deux sequences d'ADNc. 

L' expression "hybridation une temperature addquate" d6signe la reconnaissance 
par les amorces de leurs sequences compI6mentaires sur TADN matrice. 

Selon un mode de realisation avantageux, le procedd de preparation de s6quences 
nucl6otidiques selon T invention est caracterise en ce que : 

- la. premiere etape dudit proc6d6 est une etape de denaturation de I'ADNc 
codant pour une des chaines proteiques constituant la molecule d'hemoglobine 
d*Arenicola marina d'environ 10 secondes a environ 5 minutes k une temperature 
comprise d'environ 90°C a environ 1 10°C, 

- le cycle, repet6 environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de denaturation de TADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina d'environ 10 
secondes a environ 5 minutes, a une temperature comprise d'environ 90°C a 
environ 11 0'^C, 

* une etape d'hybridation des couples d'amorces de I'invention aux brins 
d'ADNc monocatenaires susmentionn^s pour obtenir des amorces 
hybridees, d'environ 20 secondes a environ 2 minutes, k une temperature 
comprise d'environ 50°C i environ 60**C, de preference d'environ 50°C a 
environ 56**C, 

* une 6tape d'Slongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase d'environ 20 secondes k environ 1 
minute et 30 secondes, k une temperature comprise d'environ 70°C k 
environ 75®C, et 

- la derniere 6tape du precede est une 6tape d'61ongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase d'environ 5 minutes a environ 
15 minutes a ime temperature comprise d'environ 70°C k environ 75°C. 

La reaction de PGR du procede de I'invention est notamment effectuee en 
presence d'ADNc (5 k 20 ng), d'amorce sens (100 ng) et antisens (100 ng), de dNTP 
(200 jiM final), de MgCh (2 mM final), de tampon PGR (foumi avec la polymerase) 
(1 X final), de la Taq polymerase (1 unite) et d'eau (25 |il qsp). 

Le proc6d6 de preparation de sequences nucleotidiques susmentionne permet 
d' obtenir des sequences codantes partielles. 
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Une fois les sequences codantes partielles obtenues grace aux experiences 
pr6c6dentes, Taniplification et le sequenfage de la totalite de la sequence codante des 
ADNc de globines et du linker sont r6alis6s par 5' RACE (Rapid Amplification cDNA 
Ends) PGR et selon les recommandations protocolaires de la fiche technique foumie par 
le foumisseur (573' RACE kit, Roche). 

La presente invention conceme 6galement un precede de preparation tel que 
defini ci-dessus, caracteris^ en ce que les couples d*amorces utilises sont tels que 
definis precedemment. 

Un precede de preparation particuli^rement avantageux selon Tinvention est un 
proc6d6 de preparation de sequences nucleotidiques tel que d6fini ci-dessus, caracteris6 
en ce que le couple d'amorces utilise est : (gar tgy ggn ccn ttr car cg ; cca ngc 

NTC YTT RTC RAA GCA) OU (GAR TGY GGN CCN TTR CAR CG ; CTC CTC TCC TCT 

CCT CTT cct), R, Y et N etant tels que definis ci-dessus, 
ledit precede 6tant caracterise en ce que : 

- la premiere 6tape du precede est une etape de denaturation de TADNc codant 
pour les chaines proteiques constituant la molecule d'hemoglobine d^Arenicola 
marina, de 4 minutes a une temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une 6tape de denaturation de I'ADNc codant pour une des chaines pmteiques 
constituant la molecule d'hemoglobine (TArenicola marina^ de 30 secondes 
a une temperature egale a 95**C, 

* une etape d'hybridation des couples d'amorces de rinventioii aux brins 
d*ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 30 secondes a une temperature 6gale a 56°C, 

* une £tape d'Slongation des amorces hybrid6es telles qu'obtenues 
precedemment par une polymerase de 40 secondes a une temperature egale 
a 72°C, et 

- la demi&re 6tape du procede est une etape d 'Elongation des amorces hybridSes 
telles qu'obtenues precedemment par une polymerase de 10 minutes k une 
temperature egale a 72°C, 

afin d' obtenir la sequence nucleotidique SEQ ID NO : 13, 

ledit procede comprenant eventuellement une 6tape supplementaire de 5' RACE 
PCR pour obtenir la sequence nucleotidique SEQ ID NO : 1 , 
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La sequence partielle SEQ ID NO :13 a ensuite 6t6 complet^e par des experiences 
5 'RACE PGR comme explique ci-dessus. La sequence nucleotidique SEQ ID NO : 13 
est une nouvelle sequence nucl6otidique codant pour une chatne prot6ique 
corrcspondant a une chaine de globine, notee A2a, SEQ ID NO : 13 comprend 376 
nucleotides. 

La sequence nucleotidique SEQ ID NO : 1 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond k un monomfere de globine 
fonctionnel) est mie nouvelle sequence nucleotidique codant poiu- une chaine proteique 
correspondant k la chaine de globine susmentionnee, notee A2a. SEQ ED NO : 1 
comprend 474 nucleotides. 

Un procede de preparation particulierement avantageux selon I'invention est un 
procede de preparation de sequences nucl6otidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (an tgy ggn ccn ctn car cg ; 
CCA NGC NTC YTT RTC RAA gca), N, Y et R 6tant tcls que definis ci-dessus, 

ledit procede etant caracterise en ce que : 

- la premiere etape du proced6 est une etape de denaturation de I'ADNc codant 
pour les chames proteiques constituant la molecule d'hempglobine d'Arenicola 
marina, de 4 minutes k une temperature egale a 95°C, 

- le cycle, repet6 35 fois, comprend les etapes suivantes : 

* ime etape de denaturation de I'ADNc codant pour ime des chaines proteiques 
constituant la-molecule d'hemoglobine d^Arenicola marina^ de 30 secondes 
k une temperature egale a 95°C, 

* une 6tape d'hybridation des couples d'amorces de Tinvention aux brins 
d*ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 30 secondes a une temperature egale a 52**C, 

* une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une polymerase de 40 secondes a une temperature egale 
i 72*^0, et 

- la demiere 6tapedu proc6de est une etape d'elongation des amorces hybridees 
telles qu'obtenues pr6cedemment par ime polymerase de 10 minutes a une 
temperature egale k 72°C, 

afin d 'obtenir la sequence nucleotidique SEQ ID NO : 15. 
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La sequence nucleotidique SEQ ID NO : 1 5 est une nouvelle sequence 
nucleotidique codant pour une chaine proteique coirespondant a une chaine de globine, 
notee A2b, SEQ ID NO : 15 comprend 288 nucleotides. 

Un proc6d6 de preparation particulierement avantageux selon Tinvention est un 
proc6d6 de preparation de sequences nucleotidiques tel que d6fini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (tgy ggn ath ctn car cg ; ctc 
CTC Tcc TCT CCT CTT cct), N, Y ct R etant tels que definis ci-dessus, 
ledit procede etant caracterise en ce que : 

- la premiere 6tape du procede est une etape de denaturation de 4 minutes a une 
temp6rature 6gale a 95®C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 30 secondes a une temp6rature egale k 53*'C, 

* une etape d'61ongation de 40 secondes k une temp6rature egale a 72*^0, et 

- la demiere 6tape du precede est une etape d'61ongation de 10 minutes a une 
temperature 6gale a 72°C, 

afin d'obtenir la sfiquence nucleotidique SEQ ID NO : 15, 

ledit procede comprenant 6ventuellement une etape supplementaire de 5' RACE 
PGR pour obtenir la sequence nucl6otidique SEQ ID NO : 3. 

La sequence partielle SEQ ID NO :15 a ensuite 6t6 compl6tee par des experiences 
5 'RACE PGR comme explique ci-dessus. 

La sequence nucleotidique SEQ ID NO : 3 (du codon initiateur au codon Stop, 
c'est k dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a la chaine de globine susmentionnee, notee A2b. SEQ ID NO : 3 
comprend 477 nucleotides. 

Un procede de preparation particulierement avantageux selon Tinvention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est : (aar gti aar can aac tgg ; ccA ngc 

NCC DAT RTC RAA) OU (aAR GTI AAR CAN AAC TGG ; CTC CTC TCC TCT CCT CTT 

cct), R, I, N et D etant tels que definis ci-dessus, 
ledit procede etant caracterise en ce que : 
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- la premiere etape du proc6d6 est une 6tape de denaturation de TADNc codant 
pour chacune des chaines proteiques constituant la molecule d'h6moglobine 
d^Arenicola marina^ de 4 minutes a une temperature egale a 95°C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une 6tape de denaturation de I'ADNc codant pour une des chaines proteiques 
constituant la mol6cule d'hemoglobine d'Arenicola marinay de 1 minute a 
une temperature egale a 95°C, 

* une etape d' hybridation des couples d'amorces de I'invention aux brins 
d'ADNc monocatenaires susmentionn6s pom obtenir des amorces 
hybridees, de 1 minute a une temperature egale a 50°C, 

* ime 6t^e d'elongation des amorces hybriddes telles qu'obtenues 
precedemment par une polymerase de 1 minute et 30 secondes k une 
temperature egale a 72°C, et 

- la demifere etape du procedd est une 6tape d' Elongation des amorces hybridees 
telles qu'obtenues precedemment par une polymerase de 10 minutes k une 
temp6rature 6gale k 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 17, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PGR pour obtenir la sequence nucleotidique SEQ ID NO : 5. 

La sequence partielle SEQ ID NO :17 a ensuite 6te compl6tee par des experiences 
5 'RACE PGR comme explique ci-dessus. La sequence nucleotidique SEQ ID NO : 17 
est une nouvelle sequence nucl6otidique codant pour ime chaine proteique 
correspondant a urie chaine de globine, notee AL SEQ ID NO : 17 comprend 360 
nucleotides. 

La sequence nucleotidique SEQ ID NO : 5 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a la chaine de globine susmentionnee, not^e Al. SEQ ED NO : 5 
comprend 474 nucleotides. 

Un procede de preparation particuliereraent avantageux selon T invention est un 
procede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d'amorces utilise est le suivant : (tgy tgy agy ath gar gay cg ; 
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CA NGC NYC RCT RTT RAA RCA) OU (TGY TGY AGY ATH GAR GAY CG ; CTC CTC TCC 

TCT OCT CTT cct), Y, H, R ct N 6tant tcls que d6finis ci-dcssus, 
ledit precede etant caracterise en ce que : 

- la premiere etape du proc6d6 est une 6tape de denaturation de TADNc codant 
pour les chaines proteiques constituant la molecule d'hemoglobine d'Arenicola 
marina, de 4 minutes a une temperature egale a 95®C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* ime etape de denaturation de I'ADNc codant pour une des chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina, de 30 secondes 
a une temperature egale a 95''C, 

* une etape d'hybridation des couples d'amorces de Tinvention aux brins. 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, de 40 secondes a une temperature egale a 52°C, 

* une 6tape d'61ongation des amorces hybridees telles qu'obtenues 
prec6demment par une polymerase de 30 secondes ^ une temperature egale 
a 72^C, et 

- la demiere etape du precede est une etape d'61ongation des amorces hybridees 
telles qu'obtenues precederament par une polymerase de 10 minutes a une 
temperature egale a 72®C, 

afm d'obtenir la sequence nucleotidique SEQ ED NO : 19, 

ledit procdde comprenant cventuellement une etape supplementaire de 5* RACE 
PGR pour obtenir la sequence nucl6otidique SEQ ID NO : 7. 

La sequence partielle SEQ ED NO :19 a ensiiite ete compiet6e par des experiences 
5*RACE PGR comme explique ci-dessus. La sequence nucleotidique SEQ ID NO : 19 
est ime nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a une chaine de globine, notee B2. SEQ ED NO : 19 comprend 390 
nucleotides. 

La sequence nucleotidique SEQ ED NO : 7 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est ime nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a la chaine de globine susmentionnee, notee B2. SEQ ED NO : 7 
comprend 498 nucleotides. 
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Un precede de preparation particulierement avantageux selon Tinvention est un 
precede de preparation de sequences nucleotidiques tel que ddfini ci-dessus, caracteris6 
en ce que le couple d'amorces utilise est le suivant : (aar gtn ath tty ggn agr ga; 
CTC CTC Tcc TCT CCT CTT cct), R, H, N et Y 6tant tels que definis ci-dessus, 

ledit precede etant caracterise en ce que : 

- la premiere etape du precede est une etape de denaturation de 4 minutes a une 
temperature egale a 95 °C, 

- le cycle, repet6 35 fois, cemprend les etapes suivantes : 

* ime etape de denaturation de 30 secondes i une temperature egale ^ 95^C, 

* une etape d'hybridation de 40 secondes a une temperature egale a 52*=*C, 

* une etape d' Elongation de 30 secondes a une temperature egale k 72°C, et 

- la demi&re 6tape du proced6 est une 6tape d'61ongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir une sequence nucleotidique partielle de reference pour continuer la 
detemiination complete de cette sequence codante, 

ledit precede comprenant une 6tape supplementaire de 5' RACE PGR pour 
obtenir la sequence nucl6otidique SEQ ID NO : 9. 

La sequence nucleotidique SEQ ID NO : 9 (du codon initiateur au codon Stop, 
c'est a dire la sequence transcrite et traduite qui correspond a un menomere de globine 
fonctionnel) est ime nouvelle sequence nucleotidique codant pour une chame pretdique 
correspondant k une chaine de globine, not6e Bl. SEQ ID NO: 9 cemprend 498 
nucleotides. 

Un precede de preparation particulierement avantageux selon rinvention est un 
precede de preparation de sequences nucleotidiques tel que defini ci-dessus, caracterise 
en ce que le couple d' amorces utilise est le suivant : (gar cay car tgy ggn ggn ga, 
CTC CTC TCC TCT CCT CTT cct), R, N et Y 6tant tels que definis ci-dessus, 

ledit precede 6tant caracterise en ce que : 

- la premiere etape du precede est une etape de denaturation de 4 minutes a une 
temperature egale a 95 °C, 

- le cycle, repete 35 feis, cemprend les etapes suivantes : 

* une etape de denaturation de 40 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 1 minute a une temperature egale a 58°C, 
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* une 6tape d'elongation de 1 minute et 10 secondes k une temperature egale a 
72*^0, et 

- la demiere 6tape du precede est une etape d*€longation de 10 minutes k une 
temperature egale k 72°C, 

afin d'obtenir une sequence nucleotidique partielle de r6ference pour continuer la 
d6tennination complete de cette sequence codante, 

ledit precede comprenant une 6tape supplementaire de 5' RACE PGR pour 
obtenir la sequence nucleotidique SEQ ED NO : 11 . 

La sequence nucleotidique SEQ ID NO : 1 1 (du codon initiateur au codon Stop, 
c'est k dire la sequence transcrite et traduite qui correspond a un monomere de globine 
fonctionnel) est une nouvelle sequence nucleotidique codant pour une chaine proteique 
correspondant a ime chaine de linker, notee LI. SEQ ID NO: 11 comprend 771 
nucleotides. 

La presente invention conceme egalement des sequences proteiques codecs par 
Tune des sequences nucleotidiques telles qu'obtenues selon le precede tel que defini ci- 
dessus. 

Une protcine preferee selon Tinvention est une proteine telle que definie ci- 
dessus, caracterisee en ce qu*elle comprend ou est constituee par ; 

- la sequence SEQ ID NO : 2 ou SEQ ID NO : 14, 

- ou toute sequence d6riv6e de la sequence SEQ ID NO : 2 ou SEQ ID NO : 14 
ou d*un fragment defini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve que ladite sequence derivee permette le 
transport de Toxygene, 

- ou toute sequence homologue de la s6quence SEQ ID NO : 2 ou SEQ ID 
NO : 14 ou d'un fragment d6fini ci-dessous, ayant de preference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 2 ou SEQ ID NO ; 14, sous reserve que ladite sequence homologue pemiette le 
transport de I'oxygfene, 

- ou tout fragment d*une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 2. 

La sequence SEQ ED NO : 2 est une nouvelle sequence proteique con-espondant a 
une chaine entiere de globine, notee A2a. 
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La sequence SEQ ID NO : 14 est une nouvelle sequence proteique correspondant 
k un fragment d'une sdquence derivee de la chaine de globine, not6e A2a, representee 
par la sequence SEQ ED NO : 2. 

Les proprietes de transport de Toxygene des sequences proteiques de Tinvention 
peuvent 6tre notamment verifi6es en mesurant leur spectre d'absorption par 
spectrophotometrie typique de roxyhemoglobine. 

Une proteine preferee salon Tinvention est une proteine telle que definie ci- 
dessus, caract6risee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ED NO : 4 ou SEQ ID NO : 16, 

- ou toute sequence derivee de la sequence SEQ ID NO : 4 ou SEQ ID NO : 16, 
ou d*un fragment d^fini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve sous reserve que ladite sequence derivee 
peiraette le transport de I'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou SEQ ID 
NO : 16, ou d*un fragment defini ci-dessous, ayant de preference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 4 ou SEQ ID NO : 16, sous reserve que ladite sequence homologue permette le 
transport de I'oxygene, 

- ou tout fi-agment d*une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d*au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 4. 

La sequence SEQ ID NO : 4 est une nouvelle sequence proteique correspondant a 
une chaine enti^re de globine, not6e A2b. 

La sequence SEQ ID NO : 16 est une nouvelle sequence proteique correspondant 
a un fragment d'lme sequence derivee de la chaine de globine, not6e A2b, representee 
par la sequence SEQ ID NO : 4. 

Une proteine preferee selon Tinvention est une proteine telle que dSfrnie ci- 
dessus, caract6risee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 6 ou SEQ ID NO : 1 8, 

- ou toute sequence derivee de la sequence SEQ ID NO : 6 ou SEQ ID NO : 18 
ou d'un fragment defini ci-dessous, notamment par substitution, suppression ou addition 
d'un ou plusieurs acides amin6s, sous reserve sous reserve que ladite s6quence derivee 
permette le transport de Toxygene, 
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- ou toute sequence homologue de la sequence SEQ ID NO : 6 ou SEQ ID 
NO : 18 ou d'un fragment d^fini ci-dessous, ayant de preference une homologie d*au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 6 ou SEQ ID NO : 1 8, sous reserve que ladite sequence homologue permette le 
transport de Toxyg^ne, 

- ou tout fragment d'une des sequences d6finies ci-dessus, sous reserve que ledit 
fragment permette le transport de I'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ED NO : 6. 

La sequence SEQ ID NO : 6 est une nouvelle sequence proteique correspondant a 
une chaine entidre de globine, notee Al. 

La sequence SEQ ID NO : 18 est une nouvelle sequence proteique correspondant 
a un fragment d'une sequence derivee de la chaine de globine, notee Al, representee par 
la sequence SEQ ID NO : 6. 

Une proteine preferee selon I'invention est une proteine telle que ddfinie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 8 ou SEQ ID NO : 20, 

- ou toute sequence derivee de la sequence SEQ ID NO : 8 ou SEQ ID NO : 20 
ou d'un fragment defini ci-dessous, notanraient par substitution, suppression ou addition 
d'un ou plusieurs acides amines, sous reserve que ladite sequence derivee permette le 
transport de I'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 8 ou SEQ ID 
NO : 20 ou d'un fragment d6fini ci-dessous, ayant de pr6ference une homologie d'au 
moins environ 75%, notamment d'au moins environ 85%, avec la sequence SEQ ID 
NO : 8 ou SEQ ID NO : 20, sous reserve que ladite sequence homologue permette le 
transport de I'oxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de i'oxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 8. 

La sequence SEQ ID NO : 8 est une nouvelle sequence prot6ique correspondant a 
une chaine entiere de globine, notee B2. 
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La sequence SEQ ID NO : 20 est une nouvelle sequence prot6ique correspondant 
a un fragment d'une sequence derivfe de la chaine de globine, notee B2, representee par 
la sequence SEQ ID NO : 8. 

Une proteine pr6feree selon Tinvention est une prot6ine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 10, 

- ou toute sequence deriv6e de la sequence SEQ ID NO : 10 ou dun fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d*un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee pennette le transport de 
Toxygfene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 10 ou d'un 
fragment defini ci-dessous, ayant de preference une homologie d'au moins environ 
75%, avec la sequence SEQ ED NO : 10, sous reserve que ladite sequence homologue 
permette le transport de Toxygfene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 10. 

La sequence SEQ ID NO : 10 est une nouvelle sequence proteique correspondant 
a une chame de globine, notee B 1 . 

Une proteine preferee selon Tinvention est ime proteine telle que definie ci- 
dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence SEQ ID NO : 12, 

- ou toute sequence derivee de la sequence SEQ ID NO : 12 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette I'association des 
chaines de globines entre elles, 

- ou toute sequence homologue de la sequence SEQ ID NO : 12 ou d'un 
fragment defini ci-dessous, ayant de preference une homologie d*au moins environ 
75%, avec la sequence SEQ ID NO : 12, sous reserve que ladite sequence homologue 
pennette Tassociation des chaines de globines entre elles, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette I'association des chaines de globines entre elles, notanmient tout 
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fragment 6tant constitu6 d'au moins environ 60 acides amines, et notamment d'au 
moins environ 280 acides amines contigus dans la sequence SEQ ID NO : 12. 

La sequence SEQ ID NO : 12 est une nouvelle sequence proteique correspondant 
i une chaine de Linker, notee LI . 

La presente invention conceme 6galement des sequences nucleotidiques telles 
qu'obtenues selon le precede tel que defini ci-dessus. 

La presente invention conceme egalement des sequences nucleotidiques codant 
pour une prot6ine telle que definie ci-dessus. 

La presente invention conceme 6galement une sequence nucleotidique telle que 
d6finie ci-dessus, caract6risee en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 1 ou SEQ ID NO : 13 codant 
respectivement pour SEQ ID NO : 2 ou SEQ ID NO : 14, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1 ou SEQ ID NO : 13, et codant respectivement 
pour une proteine representee par SEQ ID NO : 2 ou SEQ ID NO : 14, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ED NO : 1 
ou SEQ ID NO : 1 3 codant pour une proteine derivee respectivement de SEQ ID NO : 2 
ou SEQ ID NO: 14, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 1 ou SEQ ID 
NO : 13, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ID NO : 1, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 1 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

Les conditions de stringence correspondent a des gammes de temperatures 
comprises entre 48 et 60®C et de concentrations en MgCh comprises entre 1 et 3 mM. 
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La presente invention conceme egalement line s6quence nucleotidique telle que 
d^finie ci-dessus, caract6ris6e en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 3 ou SEQ ID NO : 15 codant 
respectivement pour SEQ ID NO : 4 ou SEQ ID NO : 16, 

- ou toute sequence nucleotidique derivee, par d6gen6rescence du code 
g6n6tique, de la sequence SEQ ID NO : 3 ou SEQ ID NO : 15, et codant respectivement 
pour une proteine repr6sent6e par SEQ ID NO : 4 ou SEQ ID NO : 16, 

- ou toute sequence nucleotidique deriv6e, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la s6quence SEQ ID NO : 3 
ou SEQ ID NO : 15 codant respectivement pour une proteine derivee de SEQ ID NO : 4 
ou SEQ ID NO : 16, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 3 ou SEQ ID 
NO : 15, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ID NO : 3 ou SEQ ID NO : 15, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 3 ou SEQ ID 
NO : 15 ou des sequences nucleotidiques definies ci-dessus, ledit fragment 6tant de 
preference constitue d'au moins environ 180 nucleotides, et notamment d'au moins 
environ 480 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'lme des s6quences ou d*un des 
fragments susmentionnes. 

La presente invention conceme egalement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence nucl6otidique SEQ ID NO : 5 ou SEQ ID NO: 17 codant 
respectivement pour SEQ ID NO : 6 ou SEQ ID NO : 18, 

- ou toute sequence nucleotidique derivee, par degen6rescence du code 
genetique, de la sequence SEQ ID NO : 5 ou SEQ ID NO : 17, et codant respectivement 
pour une proteine representee par SEQ ID NO : 6 ou SEQ ID NO : 18, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 5 
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ou SEQ ID NO : 17 codant respectivement pour une prot6ine ddrivee de SEQ ID NO : 6 
ouSEQIDNO : 18, 

- ou toute sequence nucieotidique homologue de SEQ ID NO : 5 ou SEQ ID 
NO : 17, ayant de preference une homologie d'au moins environ 60%, avec la sequence 
SEQ ID NO : 5 ou SEQ ED NO : 17, 

- ou tout fragment de la sequence nucieotidique SEQ ID NO : 5 ou SEQ ID 
NO : 17 ou des sequences nucleotidiques definies ci-dessus, ledit fragment etant de 
preference constitue d'au moins environ 180 nucleotides, et notamment d'au moins 
environ 480 nucleotides contigus dans ladite sequence, 

- ou toute sequence nucieotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucieotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention conceme egalement une sequence nucieotidique telle que 
definie ci-dessus, caracteris6e en ce qu'elle coraprend ou est constituee par : 

- la sequence nucieotidique SEQ ID NO : 7 ou SEQ ID NO : 19 codant 
respectivement pour SEQ ID NO : 8 ou SEQ ID NO : 20, 

- ou toute sequence nucieotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 7 ou SEQ ID NO : 19, et codant respectivement 
pour une proteine representee par SEQ ID NO : 8 ou SEQ ID NO : 20, 

- ou toute s6quence nucieotidique deriv6e, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
ou SEQ ID NO : 19 codant respectivement pour une proteine ddrivee de SEQ ID NO : 8 
ou SEQ ID NO: 20, 

- ou toute sequence nucieotidique homologue de SEQ ID NO : 7 ou SEQ ID 
NO : 19, ayant de pr6f6rence une homologie d'au moins environ 60%, avec la sequence 
SEQ ID NO : 7. 

- ou tout fragment de la sequence nucieotidique SEQ ID NO : 7 ou SEQ ID 
NO : 19 ou des s6quences nucleotidiques ddfinies ci-dessus, ledit fragment etant de 
preference constitue d'au moins environ 180 nucleotides, et notamment d'au moins 
environ 480 nucleotides contigus dans ladite sequence. 



wo 2005/037392 PCT/FR2004/002602 

25 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucl6otidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention conceme egalement une sequence nucleotidique telle que 
d6£inie ci-dessus, caracterisee en ce qu'elle comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 9 codant pour SEQ ID NO : 10, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 9, et codant pour une proteine representee par 
SEQ ID NO: 10, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 9 
codant pour une proteine derivee de SEQ ID NO : 10, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 9, ayant de 
preference ime homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 9, 

- ou tout fragment de la sequence nucleotidique SEQ ED NO : 9 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitu6 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentioxmes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'lme des sequences ou d'un des 
fragments susmentioimes. 

La pr6sente invention conceme 6galement une sequence nucleotidique telle que 
definie ci-dessus, caracterisee en ce qu'elle comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 1 1 codant pour SEQ ID NO : 12, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1 1, et codant pour une proteine representee par 
SEQ ID NO : 12, 



wo 2005/037392 PCT/FR2004/002602 

26 

- ou toute sequence nucl6otidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 1 
codant pour une proteine derivee de SEQ ID NO : 12, 

- ou toute sequence nucleotidique homologue de SEQ ID NO: 11, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ED NO : 1 1, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO: 11 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 800 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique compl6mentaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

La presente invention conceme un procede de preparation tel que d6fini ci-dessus, 
de sequences nucleotidiques codant pour les chaines proteiques constituant la molecule 
d'hemoglobine d'Annelides, notamment d'Arenicola marina, ledit procede etant 
caracterise en ce qu'il comprend les etapes suivantes : 

- une etape de mise en presence de la molecule d'hemoglobine susmentionnee 
avec au moins un agent dissociant et un agent reducteur, notamment un melange 
constitue de dithiothr6itol (DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine 
(TCEP) ou de bSta-mercapto6thanol et d'un tampon de dissociation, pendant im temps 
suffisant pour separer les chaines proteiques les imes des autres, 

permettant la dissociation, puis la reduction de ladite mol6cule d'hemoglobine, 
afin d'obtenir les chaines proteiques constituant ladite mol6cule, 

- risolement des chaines proteiques susmentioimees, 

- le micros6quen9agie par spectrometrie de masse et le sequen9age d'Edman de 
chacune des chaines proteiques isolees susmentionnees, afin d'obtenir une 
microsequence correspondant k chacune des sequences constituees de 5 a 20 acides 
amines, 

- la determination des couples d'amorces d6generees (sens et antisens) a partir 
des microsequences susmentionnees, 
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- la preparation des sequences nucleotidiques codant pour les chaines proteiques 
susmentionn6es, k partir des amorces telles qu'obtenues pr6c6demment, par un precede 
d'amplification en chaine par polymerase (PCR), comprenant les etapes suivantes : 

- la premiere etape dudit precede est une etape de denaturation de TADNc 
codant potir les chaines proteiques constituant la molecule d'hemoglobine 
d'Arenicola marina, d'environ 10 secondes a environ 5 minutes a une temperature 
comprise d'environ 90°C a environ 1 lO'^C, 

- le cycle, repete environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de denaturation de TADNc codant pour les chaines proteiques 
constituant la molecule d'hemoglobine d'Arenicola marina, d'environ 10 
secondes k environ 5 minutes, a ime temperature comprise d'environ 90°C a 
environ 11 0°C, 

* une 6tape d'hybridation des couples d'amorces de Tinvention aux brins 
d'ADNc monocatenaires susmentionnes pour obtenir des amorces 
hybridees, d'environ 20 secondes a environ 2 minutes, a une temperature 
comprise d'environ 50®C k environ 56°Cy 

une etape d'elongation des amorces hybridees telles qu'obtenues 
precedemment par une poljmfierase d'environ 20 secondes a environ 1 
minute et 30 secondes, a une temp6rature comprise d'environ 70®C a 
environ 75°C, et 

- la demi&re 6tape du precede est une 6tape d'£longation des amorces hybridees 
telles qu'obtenues pr6c6demment par une polymerase d'environ 5 minutes k environ 
15 minutes k une temperature comprise d'environ TO^C k environ 75^C. 
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DESCRIPTION PES FIGURES 

La Figure 1 represente un chromatogramme de rhemoglobine de Arenicola 
marina sur coloime Superose 12-C. La courbe superieure correspond a une absorbance 
de 414 lun et la courbe inferieure a une absorbance de 280 nm. (Le coUecteur est 
programme pour coUecter entre 16 et 18 minutes). 

La Figure 2 represente le spectre UV de Themoglobine de Arenicola marina 
fonctionnelle (sous sa forme oxyhemoglobine). 

La Figure 3 represente le chromatogramme (a 414 nm) de I'HbAm dissociee 
(partiellement) obtenu sur Superose 12-C et les traits verticaux sur le chromatogramme 
correspondent aux fenetres de coUecte (correspondant a la recuperation des sous-imites). 

La Figure 4 represente un gel SDS-PAGE obtenu pour les differentes fractions 
coUectees. 

La Figure 5 represente le chromatogramme {k 414 nm) de THbAm dissociee 
(partiellement) obtenu sur CIM DISK DEAE (systeme d*echange anionique) et les traits 
verticaux sur le chromatogramme correspondent aux fenStres de collecte. La courbe en 
pointings indique le gradient. 

La Figure 6 represente un gel SDS-PAGE obtenu pour les differentes fractions 
coUectees. 

La Figure 7 represente la cin6tique de dissociation de rHbAm en presence d*uree 
3M. L'axe des abscisses correspond au nombre de jours et Taxe des ordonnees 
correspond au pourcentage de dissociation de la mol6cule native ; la courbe en pointilles 
correspond au dodecamere ; la courbe avec les carres noirs au trimere et au "linker" 
(chaine de structure) ; la courbe avec les ronds noirs aux monomeres. 

La Figure 8 represente la cinetique de dissociation de THbAm a pH 10. L'axe des 
abscisses correspond au nombre de jours et l'axe des ordonnees correspond au 
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pourcentage de dissociation de la molecule native ; la courbe en pointiUes correspond au 
dodecamere ; la courbe avec les carres noirs au tnmere et au "linker" ; la courbe avec 
les ronds noirs aux monomeres. 

La Figure 9 represente la cinetique de dissociation de rEfcAin en presence d'uree 
3M a pH 10. L'axe des abscisses correspond au nombre de jours et I'axe des ordonnees 
correspond au pourcentage de dissociation de la molecule native ; la courbe en pointilles 
correspond au dodecamere ; la courbe avec les carr6s noirs au trimere et au "linker'* ; la 
courbe avec les ronds noirs aux monomeres. 

La Figure 10 represente le suivi de la cinetique de reassociation a partir du 
pourcentage d'HbAm (HBL) et de Dodecamere (D) et selon la technique de 
changement de tampon (Centricon ou Dialyse). L'axe des abscisses correspond au 
nombre de jours et l'axe des ordonnees correspond au pourcentage de dissociation de la 
molecule native avec la technique Centricon ; la courbe en traits pointilles correspond a 
HBL avec la technique de dialyse ; la courbe avec les triangles noirs correspond au 
dodecamere avec la technique Centricon ; la courbe en trait plein correspond au 
dodecamere avec la technique de dialyse. 

La Figure 1 1 represente la superposition des chromatogrammes de 
chromatographic d' exclusion au cours de la reassociation correspondant a differents 
temps de reassociation. 

La Figure 12 represente le chromatogramme HPLC obtenu apres separation des 
chaines polypeptidiques par phase inverse sur une colonne Symmetry CI 8 (Waters). 
Les codes (d2, al, a2, b2, c) correspondent aux noms des globines telles que 
mentionn6es dans Tarticle de Zal et al. (1997). 
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PARTIE EXPERIMENTALE 

La presente invention a pour objectif Tutilisation de rhemoglobine extracellulaire 
du polychaete marin Arenicola marina (HbAm) comme substitut sanguin chez des 
vertebres. Cependant, meme si ce ver repr^sente une biomasse importante, la synthese 
par genie genetique s'avere une voie indispensable et necessaire. II est done primordial 
d'obtenir les sequences primaires des chaines prot6ique constituant HbAm afin de 
developper une h6moglobine artificielle, fonctionnelle et stable a partir des propriet^s 
d'auto-assemblage de cette molecule. Les protocoles de dissociations de chaque sous- 
unite et de reduction en chziine polypeptidique, ainsi que les techniques de purification, 
d'isolement de microsequen? age et de sequenf age de ces chaines et sont developpees en 
detail ci-apres. 

Extraction et purification de rhemoglobine 

1) Esp^ce 6tudiee : Arenicola marina ; Ann61ide de I'dcosysteme intertidal 
L'Annelide Polychdte Arenicola marina est une espece sedentaire tr^s r6pandue 
sur toutes les c6tes de TAtlantique Nord, de la mer Noire et de T Adriatique situees au- 
dessus du quarantieme parallele. Dans la region de Roscoff, rArenicole, commun6ment 
appel6e "ver du pecheur" constitue des populations denses. Le sediment habite par ces 
populations presente une surface irreguliere alternant bosses et creux formes 
respectivement par des monticules de dejections et des depressions coniques. 
L'Arenicole vit dans des galeries amenag6es dans le sable. La structure de la galerie se 
presente sous forme de U, avec une branche ouverte sur Textdrieur, I'autre etant ferm6e. 
L'Ar6nicole est logee dans la partie horizontale, son extremity cephalique orientee vers 
la partie aveugle. EUe ingfere le sable, en extrait la matifere organique assimilable et 
ddf&que ensuite par son extr6mit6 caudale, formant ainsi des monticules de tortillons de 
sable. A Tinterieur de Tetage mediolittoral, la repartition et la density des peuplements 
sont essentiellement commandees par la granulometrie, la concentration en matiere 
organique et la salinite. 

L'Ar6nicole, vivant surtout dans les zones de balancement des marees, est amenee 
a subir des variations de pression d*oxyg6ne. Sa galerie lui permet d'Stre en contact 
permanent avec Teau de mer (riche en oxygfene), pendant la maree basse. 
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2) M6thodes d'dtude 

2. 1 . Prdlfevement du materiel biologique 

Les animaux sont rteoltes k mar6e basse, dans la baie de Penpoull, pres de 
Roscoff (France) et maintenus dans Teau de mer una nuit afin de vider leur tube 
digestif. Les prelevements de sang sont effectues a Taide d'une seringue au niveau du 
vaisseau dorsal. Les echantillons sont collectes sur de la glace et filtres sur de la laine de 
verre. Apres une centrifugation a froid (15 000 g pendant 15 min a 4°C) pour eviter la 
dissociation des molecules et pour eliminer les debris tissulaires, les sumageants sont 
concentres au moyen d'une cellule Amicon (Millipore) et d'une membrane de "cut-off 
de 500 kDa (ne sont retenues que les masses superieures a 500 kDa). 

2.2, Purification des hemoglobines 

Une fois le sang concentre, une filtration basse pression (FPLC) par exclusion 
(separation en fonction de la taille de la molecule : plus la molecule est de taille 
importante plus elle est eluee rapidement) est effectuee sur colonne (100 x 3 cm) de gel 
Sephacryl S-400 (Amersham)(ganime de separation comprise entre 20 x 10^ et 8000 x 
10^), en chambre firoide (4®C). Chaque purification est effectuee sur 5 mL d'fchantillon, 
elues avec le tampon sale Arenicola marina (10 mM Hepes ; 4 mM KCl ; 145 mM 
NaCl ; 0,2 mM MgCh ajust6 k pH 7,0 avec de la sdude 2N). Le debit utilis6 pour cette 
premiere purification est de 40 tr/min et n'est recuper6 que la premiere firaction la plus 
rouge (contenant de Theme). Cette fi-action est ensuite concentree a Taide de tube 
Centricon-lOkDa retenant les mol6cules d'un poids superieur ou egal k 10000 Da. 

Une deuxieme purification est msuite eflFectu6e par filtration basse pression 
(Systeme HPLC, Waters) d*aliquot de 200 ^L sur une colonne 1 x 30 cm Superose 
12-C (Pharmacia, gamme de s6paration comprise entre 5 x loi' et 3 x 10^ Da) k 
temperature ambiante. Le debit utilise est de 0,5 ml/min. Les 6chantillons sont 
conserves a 4°C et recoltes dans de la glace. L'absorbance de T^luat est suivie k deux 
longueurs d'ondes : 280 nm (pic d'absorbance caracteristique des proteines) et 414 nm 
(pic d'absorbance caracteristique de Theme). Les firactions contenant de Theme sont 
isolees grace au collecteur (programme sur une fenetre de temps correspondant au 
temps de retention de Th6moglobine)(Figure 1). Les echantillons sont concentres, 
doses, puis stockes a ~40^C avant utilisation. 
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2.3. Dosage des hemoglobines 

Le reactif de Drabkin (Sigma), utilise pour le dosage, permet de determiner la 
quantite en heme de la solution. L'hemoglobine reagit avec le reactif de Drabkin lequel 
contient du potassium de ferricyanure, du cyanure de potassium et du bicarbonate de 
sodium. L'hemoglobine est transfonnee en methemoglobine par Taction du 
ferricyanure. Les methemoglobines reagissent ensuite avec le cyanure pour former le 
cyanmethemoglobine. L'absorbance de ce derive a 540 nm est proportiormelle a la 
quantite d'heme dans la solution. Or, Themoglobine extracellulaire de Arenicola marina 
(HBL) contient en moyenne 1 mol d'heme pour 23 000 g de proteine, ce qui permet par 
un calcul simple, d'obtenir la concentration en HBL de chaque echantillon. 

3) Resultats 

Ainsi, plusieurs milligrammes d'hemoglobine extracellulaire de Arenicola marina 
ont ete purifies. Chaque lot (aliquots de ImL) est analyse par FPLC sur colonne 
Superose 12-C (Pharmacia) afin de s'assurer de la purete de I'echantillon (un pic 
unique). De meme un spectre UV sur une plage de 400 nm a 700 nm est realise pour 
verifier la fonctionnalit6 des hemoglobines de chaque lot (Figure 2). Trois maxima 
d'absorption sont observes a 414, 541 et 577 nm. Par comparaison, on rappelle que la 
methemoglobine presente deux maxima a 500 et 635 nm. 

Enfin, ces lots sont utilises par la soci6t6 Biotrial S.A. (Rennes, France) pour des 
tests precliniques r6alis6s sur des souris et des rats afin de tester les eventuelles 
reactions pathologiques et immunog^nes. 

Dissociation de rh^moglobine extracellulaire de Arenicola marina en ces 
diiferentes sous-unit6s de base (Trimferes, Dimferes de linker et Monomtres) 

La dissociation de Themoglobine extracellulaire d!* Arenicola marina (HbAm) doit 
6tre totale et conserver les sous-unites fonctionnelles. Les differentes sous-unites sont 
ensuite isolees et analysees par des techniques de chromatographic liquide (exclusion et 
echange d*ions), developptes k cet effet. 
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1) Dissociation de I'HBL 

1.1. Protocole de dissociation 

Les 6tudes preliminaires de dissociation ont ete developpees a partir des 
publications de I'art ant6rieur (Vinogradov et al., 1979; Sharma et al., 1996; 
Mainwaring et al., 1986 ; Polidori et al., 1984 ; Kapp et al., 1984 ; Chiancone et al, 
1972 ; Vinogradov et al., 1991 ; Krebs et al., 1996), c*est-a-dire en presence d'un reactif 
dissociant unique : ur6e, ions heteropolytungstate, sels de guanidinium, SDS ou ions 
hydroxydes. Les agents utilis6s agissent differemment sur la molecule : 

- les ions hydroxydes (OH"), le SDS, les sels de guanidinium et les ions 
hetercpolytungstate destabilisent les ponts salins 

- Turde destabilise les interactions hydrophobes 

Or, I'interet est d'obtenir le plus rapidement et le plus efficacement possible les 
quatre sous-unites de bases d'ou I'idee d'associer les differents agents dissociants et en 
particulier le pH alcalin et Turee. Apres differents tests, il s'avere qu'une dissociation 
rapide et efficace est obtenue avec de I'uree 3M dilue dans le tampon de dissociation 
(0,1 M de base Trisma et ImM d'EDTA) ajuste k pH 10 avec de la sonde 2N. L'HbAm 
est ajustee a une concentration d' environ 4 mg/mL (solution mere). Toutes les analyses 
sont effectuees a +4''C et les echantillons sont conserves a I'obscurite le temps de 
Tetude. (Trisma = tris[hydroxym6thyl]aminomethane) 

1.2. Analyses par chromatographic d' exclusion 

Les conditions d'analyses sont d6taill6es dans le tableau 1 ci-dessous. 



Syst^me HPLC 


HPLC Waters 626 LC System 


Colonne 


Superose 12-C (Pharmacia) 
(^amme de separation comprise entre 5xl(P et 3x10^ Da) 


Debit 


0.5 mL/min 


Eluant 


tampon pH 7,0 
(tamponne par exetnple avec de Vacide chlorhydrique concentre) 
et filtre sur filtre 0,22 ^Im (ou OASiim) 


Temperature 
de rinjecteur 






Echantillon 

Suivi Analytique Separation et collecte 


Volume injecte 


20M.L 


200^L 


Preparation 
des echantillons 


Solution mere diluee a Img/mL 
dans le tampon de dissociation k 
pHlO et f iltree sur 0,45jim 


Solution mere filtree sur filtre 0,45^m 
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1.3. Analyses par echange d' ions 

Le point isoelectrique (pHi) de I'HBL 6tant de 4,69 (Vinogradov, 1985), Tanalyse 
par echange d'ions est realisee sur une colonne anionique CIM DEAE disk (Interchim). 
En effet, L'HBL est chargee n6gativement pour un pH superieur au pHi et est done 
fixee sur une resine chargee positivement (resine DEAE). L*elution est effectuee grace a 
la force ionique avec un gradient non lineaire de NaCl de 0 a 1 M (solution de NaCl de 
1 M diluee dans le tampon de dissociation k pH 7,0 et filtree sur 0,45 ^.m). Le tampon 
de dissociation a pH 7 est utilise comme tampon d'61ution. Le debit est de 4 mL/min. 

1.4. Analyses par chromatographie en phase inverse 

La chromatographie par phase inverse est effectuee sur une colonne de Symmetry 
300 Ci8 Sfim (4,6 x 250 mm) de chez Waters. En presence d'ac6tonitrile et de TFA 
(acide trifluoroac^tique), HbAm se dissocie en ses sous unites de base (Trimere, 
Monomere et Linker) et Theme se dissocie des globines. Ainsi, sans traitement 
prealable, HbAm est dissociee en tete de colonne. La methode developpee est decrite 
dans le tableau ci-<iessous. 



debit 


1 mL/min 


Eluant A 


H2O MiUiQ + 0.1% v/v HEBA 


EluantB 


ACN + 0.1% v/v HFBA 


Gradient 




Temps en 
min 


% A 


%B 




0 


58 


42 




40 


50 


50 




41 


48 


52 




90 


47 


53 




95 


5 


95 




110 


5 


95 



2) Resultats 

2.1. Chromatographie d'exclusion 

Le chromatogramme de THbAm dissociee en partie, est represent^ figure 3. Cinq 
pics sont observes et il s'agit de les identifier. Les molecules sont eluees selon leur 
masse decroissante et THbAm native elue dans le volimie mort (16 min). Les jfractions 
correspondant k chaque pic sont analys6es par SDS-PAGE (figure 4). Les r6sultats sont 
pr6sent6s dans le tableau 2 ci-dessous. 
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Fractions 


Temps de retention 


Sous-unit6s 


1 


16inin40 


HbAm native 


. 2 


22 min 20 


Dodecamere 


3 


25 min 30 


Dimfere de linker 


4 


26 min 40 


Trimere 


5 


28 min 30 


Monomeres 



2.2. Chromatographic ionique 

Une fois la methode developp6e (tableau 3), les fractions sont coUectees, 
concentrees et analysees par gel SDS afin d'identifier chaque pic (Fig. 6 et tableau 4), 
Une methode est ensuite developpee pour repurifier chaque sous-unite. 



Temps 
en min 


AilMNaCl 
dans B 


B : Tampon de 
dissociation pH 7.0 


0 


5% 


95 % 


0,5 


15% 


85 % 


1,5 


15% 


85 % 


2,5 


22% 


78% 


3,5 


22% 


78% 


3,6 


25% 


75% 


5,5 


25% 


75 % 


5,6 


29% 


71 % 


6,5 


29% 


71 % 


6,6 


36% 


64 % 


7.0 


36% 


64% 


8,0 


45% 


55 % 


8,1 


100% 


0% 


9,5 


100% 


0% 



TABLEAU 3 : M6thode developp6e pour T analyse de THBL dissociee sur CIM-DEAE 



fractions 


Temps de 
retention 


Sous-unites 


1 


1 min 15 


Monomeres 


2 


2 min 40 


Dimfere de linker 


3 


3 min 10 


Dimere de linker 


4 


4 min 40 


Dodecamere 


5 


6 min 30 


? 


6 


7 min 30 


Trimere 


7 


8 min 50 


HbAm 



TABLEAU 4 : Association reahsee apres 
analyse du gel (Figure 6) entre le temps de 
retention et les sous-iinit6s. 
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2.3. Chromatographie en phase inverse 

Une fois la methode d6veloppee, les fractions sont coUectees, lyophilis6es et 
analysees par spectroni6trie de masse afin d'identifier chaque pic. 



fractions 


Temps de 
retention 


Sous-unites 


1 


12 min 


Linker 


2 


22 min 


Linker 


3 


34 min 


Monomere al 


4 


38 min 


Monomere a2 


5 


50 -70 min 


Trimeres 



Les proprietes chimiques des trimeres doivent etre trop proches pour que Ton 
puisse les separer par phase inverse. Ainsi, seuls les deux linkers et les monomeres al et 
a2 ont pu etre isoles. 

2.4. Dissociation de THbAm 

La cinetique de dissociation est suivie par chromatographie d'exclusion, 
L'integration des chromatogrammes par le logiciel Millenium (Waters), permet le calcul 
du pourcentage des difFerents composes a partir de Taire sous courbe. L*evolution de la 
cinetique de dissociation est representee figures 7, 8 et 9. 

Les trois graphiques des Figures 7, 8 et 9 montrent bien Tinteret d'associer les 
deux agents dissociants (uree 3M et OH") pour obtenir efficacement les trois sous-unites 
de base en 24h. 

R6as50ciation de Fh6moglobine 

1) Materiels et methodes 

Les experiences de reassociation sont efTectuSes sur THbAm dissocide selon les 
protocoles cites plus haut (pH9, pHlO, Uree 3M, Uree 4M, Uree 3M a pHlO). 
Diffdrmts tampons de r6association sont testes afin d'obtenir xme reassociation 
optimale. Le changement de tampon (tampon de dissociation tampon de 
reassociation) est e£fectu6 de deux fa?dns difFerentes : 

- L*HbAm dissociee est lavee 4 fois contre 4 mL de tampon de reassociation sur 
Centricon-lO (Millipore) a +4°C ; 
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- L'HbAm dissoci6e est dialysee 24 h centre de Teau MilliQ (Millipore) (2 x 
2L) puis 48 h contre le tampon de r6association (3 2L) k -f4**C. 



2) Resultats 

D'apres des resultats ultSrieurs sur les hemoglobines extracellulaires d'Annelides 
(Mainwaring et al., 1986 ; Polidori et al., 1984), la presence d'ions divalents tels que 
Ca^^ et Mg^"^ est necessaire au maintien de la structure quatemaire de rhemoglobine. En 
effet, lis la stabilisent et ralentissent le ph6nomene de dissociation (Sharma et al., 1996). 
Ces ions forment un complexe avec les groupes carboxylates des chaines laterales et 
carbonyles des chaines principales. La presence d'ions divalents peut avoir un effet sur 
la reassociation lorsque les groupements carboxyliques sont ionises, done entre autre 
lorsque la dissociation a eu lieu k pH alcalin. II est done important que le tampon de 
reassociation contienne du calcium et/ou du magnesium. Ceci explique aussi la presence 
d'EDTA dans le tampon de dissociation ; EDTA qui chelate ces ions divalents. Le 
tampon actuellement mis au point est constitue de 0,1 M de base Trisma, 400 mM de 
NaCl, 2,95 mM KCl, 32 mM MgS04, 11 mM CaCl2 ajuste a pH 7 avec de THCl 
concentre. La reassociation est suivie selon le meme principe que la dissociation 
(Figures 10 et 11). 

Une reassociation est observee si la dissociation est de courte duree de Tordre de 
la minute. Cette reassociation correspond k un rearrangement d'intermediaires de 
dissociation qui sont des hemoglobines tronquees (HBL dissociee de 1 a plusieurs 
douziemes). 

Reduction de THbAm pour Tetude des difKrentes chaines polvpeptidiques 

1) Reduction de Th^moglobine pr6alable k la s6paration par chromatographie 
liauide par phase inverse 

L'HbAm (4 mg/mL) est reduite dans 10% de DTT (dithiothreitol) dissous dans un 
tampon de dissociation a pH 8-9 (0,1 M trisma ou 10 mM bicarbonate d'anunonium) 
pendant 30 minutes k temperature ambiante. Une fois reduites, les chaines proteiques 
obtenues sont alkylees en presence de lOOmM iodoac6tamide dissout dans xm tampon 
de dissociation a pH 8-9 pendant 30 minutes a temperature ambiante. 

On peut eventuellement egalement envisager le protocole suivant : L'HbAm (4 
mg/mL) est reduite dans 100 mM de DTT (dithiothr6itoI) dissout dans le tampon de 
dissociation k pH 8-9 pendant 1 h a 40°C. Dans ces conditions drastiques, seules les 
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globines pourront etre analys6es. En effet, .les linkers (proteines non-globines) sont 
riches en. cysteines et sont done d6t6rior6s. Une fois reduite, THbAm est lavee 4 fois sur 
Amicon 30 GOODa (Millipore) dont seul le filtrat est recuper^ (tout ce qui est de poids 
inferieur a 30 000 Da). Le filtrat est ensuite lave sur Amicon 10 OOODa pour eliminer 
tout ce qui est inferieur a 10 000 Da. Ainsi, seuls les monomeres compris entre 30 000 
Da et 10 000 Da sont contenus dans Techantillon (gamme de poids des chaines de 
globines qui constituent THbAm). 



2) Separation des chaines proteiques par chromatographie de phase inverse 
2.1 . Materiels et methodes 

La chromatographie par phase inverse est effectuee sur ime colonne de Symmetry 
300 Ci8 Sum (4,6 x 250 mm) de chez Waters. La m6thode developpee est decrite dans 
le tableau ci-dessous et le chromatogramme obtenu est reprSsente figure 12. 



debit 


1 mL/min 


Eluant A 


H2O MilliO + 0.1% v/v HFBA 


Eluant B 


ACN + 0.1%v/vHFBA 


Gradient 




Temps en 
min 


% A 


%B 




0 


75 


25 




2 


58 


42 




10 


58 


42 




40 


40 


60 




45 


0 


100 




55 


0 


100 



On peut eventuellement egalement envisager le protocole suivant. 



debit 


1 mL/min 


Eluant A 


HjO MilliO + 0. 1% v/v TFA 


Eluant B 


ACN + 0.1% v/vTFA 


Gradient 


Temps en min 


%A 


%B 


0 


80 


20 


0,25 


60 


40 


4,0 


55 


45 


10,0 


55 


45 


10.05 


0 


100 


16,0 


0 


100 



Chaque chaine proteique (mises en evidence par un pic unique i 280nm) est 
collect6e puis lyophilisee et stock6e k -40°C jusqu*aux prochaines analyses. Ainsi, il a 
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ete possible de separer les 5 monomeres suivants : ai (-15952 kDa), a2 (--15975 kDa), 
d2 (^17033 kDa), (--16020 kDa) et c (--16664 kDa). 



3) S6paratioD des chames proteiques par gel bidimensionnel 

Le gel bidimensionnel qui est ime combinaison des techniques 

d'isoelectrofocalisation en premiere dimension et de SDS-PAGE en seconde dimension 

permet de separer un melange complexe de proteine. 

Electrofocalisation 

Apres purification par FPLC, Themoglobine de Arenicola est dialysee et 
lyophilisee. 500 \ig sont repris dans un tampon de rehydratation. Ce tampon contient du 
Chaps (3-[(3-cholamidopropyl)dimethylammonio]-l-propane-sulfonate ; Sigma) a 4%, 
1% de DTT fraichement prepare, cocktail d'inhibiteurs de protease (Bohringher), 50 
|ig/ml de TLCK (inhibiteur de la trypsine), 1 \l\ de Bleu de Bromophenol a 1%. 

Le melange est soniqu6 et centrifuge pour eliminer le materiel non dissous. On 
depose ensuite de Thuile de roche aux deux extremites du support de la bande 
d' Electrofocalisation, et on depose ensuite I'dchantillon au milieu. La bande de 17 cm 
est ensuite d6posee sur I'echantillon en eliminant toute bulle d'air. La bande est alors 
recouverte d'huile de roche pour evitCT Tevaporation de Techantillon. 

Une rehydratation active est alors r6alis6e k 50V (20°C durant 12 heures). Ensuite 
nous procedons a la focalisation durant deux jours. 

La bande sera ensuite recup6ree et placee sur un gel d'acrylamide 6-18%, 
notamment a 10%, de largeur 18 cm, de longueur 20 cm et d'epaisseur 1 mm. La 
migration est effectuee en enceinte refrigeree a lO^C, pendant 14 hewes a 400 V, 25 
mA et 100 W. 

La separation des chaines proteiques sera alors realisEe en fonction de leur taille 
aprfes avoir scell6 la bande en haut du gel k Taide d'une solution d*agarose k 1%, Une 
fois separ6es, les bandes proteiques sont r6v616es sur gel par coloration au bleu de 
Coomassie (Coomassie® G250). 

Construction du gel en gradient 

Vingt-cinq ml de solution dense k 18% de polyacrylamide (acrylamide 2,5 M; 
Tris 0,4 M ; Glycerol 30% (v/v) ; dodecy] sulfate de sodium (SDS) 3,5 mM ; TEMED 
(N,N,N',N'-tetram6thylethylenediamine ; Sigma) 0,05% (v/v) ; persulfate de sodium 
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1,6 mM) sont places dans la chambre de melange sous agitation constante tandis qu'un 
m6me volume de solution 16gere k 6% de polyacrylamide (acrylamide 0,8 M ; Tris 0,4 
M ; SDS 3,5 mM ; TEMED 0,06% (v/v) ; persulfate de sodium 2,4 mM) est place dans 
Tautre chambre. Le haut du gel est reconvert d'une solution d'isobutanol satur^e en eau 
bidistill^e. Le gel est ensuite laisse 1 h a polymeriser k temperature ambiante puis le 
haut du gel est rince plusieurs fois avec de Teau bidistillee et T ensemble est place une 
nuit a lO^^C. Aprfes avoir enleve I'eau residuelle k I'aide d'un papier absorbant, la 
solution de gel de concentration (acrylamide 0,56 M ; methylene bis-acrylamide 6,9 
mM ; Tris 124 mM ; SDS 3,5 mM ; TEMED 0,05% (v/v) ; persulfate de sodium 2,2 
mM) est coulee sur le gel de separation et une cale pemiettant de former Tempreinte de 
la bande est introduite dans la solution gel de concentration. La polymerisation est 
complete apres 1 h ^ temperature ambiante. 

4) Analyse par micro sequencage des chaines proteiques isolees par phase inverse 
et gel bidimensionnel 

Les chaines proteiques isolees par chromatogre^hie en phase inverse et par gel 
bidimensioxmel sont ensuite digerees et analysees par spectrometrie de masse LC- 
MS/MS sur un appareil de type ESI-Q-TOF, 

Digestion des proteines separees par chromatographie en phase inverse, 
Chaque chaine proteique isolee est soumise a une digestion enzymatique, 6tape 
essentielle avant leur analyse par microsequen9age. Les chaines proteiques lyophilisees 
sont dissoutes dans une solution eau milliQ, acetonitrile contenant Tendoprotease ; la 
trypsine qui hydrolyse au niveau C-terminal de la lysine et de Targinine, donnant 
g6neralement des peptides de masses comprises entre 500 et 2500 Da, pendant au 
minimum 3h a temperature ambiante. 

Digestion des proteines separees sur gel bidimensionnel 

Chaque spot du gel est d^coupe pour 6tre soumis k une digestion enzymatique. 
Cette etape de digestion enzymatique est essentielle. EUe consiste k hydrolyser les 
proteines de fa9on specifique, a I'aide d'une enzyme, en plusieurs peptides. 

Avant de debuter la digestion, des 6tapes de decoloration, de reduction et 
d'alkylation sont indispensables : 
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• les lavages successifs a rhydrog&iocarbonate d'ammonium (NELjHCOa) et a 
racetonitrile (ACN) permettent d'Sliminer Tagent de coloration prdsent dans le 
morceau de gel, 

• les reactions de reduction au dithiothriitol (DTT) et d'alkylation a 
riodoac6tamide permettent Touverture puis le blocage des ponts disulfures formes entre 
deux cysteines presentes dans la sequence de la proteine et des liaisons cysteine- 
acrylamide. 

La demiere etape de la methode consiste a extraire du gel les peptides trypsiques a 
I'aide d'une solution d'extraction, composee d'acetonitrile et d*eau, additionnee d'un 
peu d'acide. 

Analyse par nanoLC-MS-MS 

Les peptides extraits sont ensuite transferes vers la plaque PGR, Ce transfert se 
fait en deux fois 15 |llL, pour recup6rer la totalite du volume. Pour eliminer 
racetonitrile, qui pourrait gener la retention des peptides sur la pr6-colonne, un temps 
d'evaporation (pause) de 2 heures est applique avant Tanalyse par nanoLC-MS-MS. 

Resultats 

Ceci a permis I'obtention de quelques centaines de micosequences correspondant 
a chaque chaine proteique separee par gel 2D. 

5) Analyse par s6quencage d*Edman des chaines oroteioues isolees par 
chromatographie en phase inverse 

Principe 

En presence de tampon N-methyl pipdridine, le Phenyl-Iso-Thio-Cyanate (PITC) 
se couple aux fonctions amines primaires et secondaires des proteines (PTC-Proteine). 
Le temps de reaction k 45°C est de 18 minutes. La liaison pqjtidique suivante est 
fragilis6e, ce qxii permet sa coupure en 3 minutes par Tacide trifluorac6tique (TFA) pur 
gen6rant ainsi I'anilino-thiazolinone (ATZ) du premier acide amin6 (AA) et la proteine 
ayant perdu le 1 er AA. 

L*ATZ-AA est extrait du milieu rdactionnel et converti en milieu acide (TFA k 25 
% dans Teau) en phenyl thio-hydantoYne (PTH-AA) plus stable. Le PTH-AA pent done 
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Stre analyse par HPLC et sa nature determine grSce i un 6talon de PTH-AAs. Le cycle 
de reaction peut etre rep6t6 et conduit ainsi k la sequence de la prot6ine. Edman a 
automatise la reaction qui porte son nom en cr6ant en 1967 le premier sequenceur de 
prot6ine. L*appareil est couple a une HPLC dans laquelle il injecte le PTH-AA. Par 
comparaison avec un spectre 6taIon, il est alors possible d'identifier Tacide amine 
d'origine et d'obtenir sa quantification. Le tout est sous le controle d'un ordinateur qui 
pilote les diffdrents elements et assure Tacquisition de donnees ainsi que leur traitement. 

Resultats 

Ainsi, il a ete possible d'obtenir environ 30 acides amines des extremites N- 
teraiinales de 5 monomeres et d'un linker isoles par phase inverse. 

Details des protocoles d'amplification par PCR et presentation des sequences 
nucl6otidiques et polvpeptidiques des globines des sous-families Ah A2a^ A2b^ B2 
et Bl et du linker LI du polvchfete marin Arenicola marina 

Les amplifications par PCR des 5 globines Al, A2a, A2b, Bl et B2, ainsi que du 
linker LI, dont les sequences nucleotidiques sont presentees ci-dessous, ont debute par 
la conception d'amorces degenerees specifiques (sens et antisens) des sous-families Al, 
A2, Bl et B2. Ces amorces, qui ont permis I'amplification des cinq globines 
susmentionnees (Al, A2a, A2b, Bl et B2) puis le clonage et le s6quen5age des produits 
de PCR correspondants, ont ete confues a partir d'alignements de sequences proteiques 
de globines d'annelides disponibles dans les banques de donnees. 

Les matrices d'ADN compl6mentaires utilisees pour les reactions de PCR ont ete 
synth6tis6es a partir d'ARN messagers purifies k partir d'ARN totaux extraits sur des 
Ar^icoles, en raison de la petite taille des organismes et de leur rythme intense de 
croissance traduisant des niveaux importants d'expression des genes, dont ceux 
impliqu6s dans la synthese de I'hemoglobine. Les ADN complementaires ont ainsi et& 
synth6tis6s. Ces 6tapes ont fait appel k des kits commerciaux de biologic moleculaire de 
chez Ambion (purification des ARNs), Amersham (purification des ARNm), Promega * 
(RT), Invitrogene (clonage), Abgene (sequenfage). 
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Dans un second temps, nous avons mis au point les reactions de PCR, notanunent 
en ce qui conceme la determination des parametres de temps de denaturation, de temps 
et de tempfrature d'hybridation et de temps d'elongation. Les concentrations en MgCb 
ont 6galement 6tj& optimises. 

Enfin, dans ime demidre etape, des experiences de 5' et 3' RACE PGR ont 6x6 
efFectuees de fa9on k obtenir les sequences cbdantes completes. Ces etapes ont fait 
appel au kit de biologic mol6culaire de chez Roche. 

Sont presentees ci-dessous, les sequences nucl^otidiques des amorces degenerees 
sens et antisens, les paramfetres des PGR et les sequences codantes partielles ou 
completes pour chacune des globines A2a, A2b, Al , Bl et B2, et pour le linker LI . 

On precise que Tanalyse totale de ces sequences par un blast dans les banques de 
donnees donne des valeurs comprises entre 2.10"^ < Evalue < 5^'"^^ . 

Globine A2a 

Pour obtenir la sequence nucleotidique SEQ ID NO : 1 codant pour la globine 



A2a (SEQ ID NO : 2), on utilise le couple d'amorces (SEQ ID NO : 19 ; 
SEQ ID NO: 20). 

Les conditions de PGR sont les suivantes : 



1 00 ng amorce sens 
100 ng amorce antisens 
dNTP 200 \xM final 
MgCl2 2mM final 
Tampon PGR IX final 
1 unite Taq Polymerase 
Qsp 25 iiL H2O 



Temps et temperature initiale de denaturation : 
Temps et Temp6rature de denaturation : 
Temps et Temperature d'hybridation : 
Temps et Temperature d'elongation : 
Temps et Temperature d'eiongation finale : 




4 min k 95°C 



10mina72^G 



Reaction de PGR : 



Par reaction : 



5-20 ng ADNc 
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Globine A2b 

Pour obtenir la sequence nucleotidique SEQ ID NO : 3 codant pour la globine 
A2b (SEQ ID NO: 4), on utilise le couple d'amorces (SEQ ID NO: 21; 
SEQ ID NO : 20). 

Les conditions de PGR sont les suivantes : 

PGR : 4 min a 95°G 



40 s a 72*0 J 
10mina72°C 

Globine Al 

Pour obtenir la sequence nucleotidique SEQ ID NO : S codant pour la globine Al 
(SEQ ID NO : 6), on utilise le couple d'amorces (SEQ ID NO : 22 ; SEQ ID NO : 20). 
Les conditions de PGR sont les suivantes : 
PGR : 4 min 4 95*0 

1 min ^ 95*'C ■>> 



1 min 30 a 72''G ^ 
10 min k 72°C 

Globine B2 

Pour obtenir, la sequence nucleotidique SEQ ID NO : 7 codant pour la globine B2 
(SEQ ID NO : 8), on utilise le couple d'amorces (SEQ ID NO : 23 ; SEQ ID NO : 20). 
Les conditions de PGR sont les suivantes : 
PGR : 4 min a 95°G 

30 s a 95°G ~^ 




35 cycles 





35 cycles 



10mina72*C 
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Globine Bl 

Pour obtenir la sequence nucl6otidique SEQ ID NO : 9 codant pour la globine Bl 
(SEQ ID NO : 10), on utilise le couple d'amorces (SEQ ID NO : 24 ; SEQ ID NO : 20). 
Les conditions de PGR sont les suivantes : 
PGR: 4 min a 95°G 



30 sk IIPC J 
10mina72°G 

Linker LI 

Pour obtenir la sequence nucleotidique SEQ ID NO : 1 1 codant pour le Linker LI 
(SEQ ID NO : 12), on utilise le couple d'amorces (SEQ ID NO : 25 ; SEQ ID NO : 20). 
Les conditions de PGR sont les suivantes : 
PGR: 4mina95^G 




35 cycles 




35 cycles 



10mina72°G 
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REVENDICATIONS 

1. Precede d'obtention des chaines proteiques constituant la molecule 
d'hemoglobine extracellulaire d' Annelides, notamment d^Arenicola marinay 

ledit precede etant caracteris6 en ce qu*il comprend line etape de mise en presence 
d'un 6chantillon d'hemoglobine extracellulaire d'Annelides, notamment d^Arenicola 
marina avec au moins un agent dissociant, et le cas echeant im agent reducteur, 
notamment un melange constitu6 de dithiothreitol (DTT) ou de chlorhydrate de tris(2- 
carboxyethyl)phosphine (TCEP) ou de beta-mercapto6thanol et d'un tampon de 
dissociation, pendant un temps suffisant pour separer les chaines proteiques les imes des 
autres. 

2. Procede selon la revendication 1, caracterise en ce que le tampon de 
dissociation comprend un agent tamponnant a une concentration comprise d'environ 
0,05 M a environ 0,1 M, notamment du Trisma (tris[hydroxymethyl]aminomethane) et 
0 4 10 mM d'EDTA ajuste a un pH compris d'environ 5 a environ 12, et de preference 
d'environ 7,5 a 12. 

3. Procede selon la revendication 1 ou 2, caract6ris6 en ce que les chaines 
proteiques constituant ladite molecule sont obtenues par la reduction de quatre sous- 
unites par un agent reducteur, par exemple en presence de DTT, lesdites sous-unit6s 
etant elles-memes obtenues par mise en presence d'un echantillon d'h6moglobine 
extracellulaire d^Arenicola marina avec difTerents agents dissociants, notamment un 
tampon de dissociation. 

4. Proc6de de preparation de couples d'amorces k partir des chaines proteiques 
telles qu'obtmues selon le proced6 tel que defini dans Tune des revendications 1 & 3, 
ledit proced6 6tant caract6rise en ce qu'il comprend les etapes suivantes : 

- risolement de chacune des chaines prot6iques constituant la mol6cule 
d'hemoglobine telles qu*obtenues selon le proc6d6 tel que defini selon Tune des 
revendications 1 a 3, 

- le microsequenfage par spectrom6trie de masse et par sequen^age d'Edman de 
chacune des chaines proteiques isolees susmentionn6es, afin d'obtenir une 
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micros6quence correspondant k chacune des sequences constituees de 5 a 20 acides 
amines, et 

- la determination de couples d'amorces degenerees a partir des microsequences 
susmentionnees. 

5. Couples d'amorces tels qu'obtenus selon le precede de la revendication 4, 
lesdits couples etant notamment les suivants : 

a) Amorce sens : GAR TGY GGN CCN TTR CAR CG (SEQ ID NO : 21 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO: 22 

b) Amorce sens : TGY GGN ATH CTN CAR CG (SEQ ID NO : 23 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22 

c) Amorce sens : AAR GTI AAR CAN T^C TGG (SEQ ID NO : 24 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22; 

d) Amorce sens : TGY TGY AGY ATH GAR GAY CG (SEQ ID NO : 25 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22 

e) Amorce sens : AAR GTN ATH TTY GGN AGR GA (SEQ ID NO : 26 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22 

f) Amorce sens : GAR CAY CAR TGY GGN GGN GA (SEQ ID NO : 27 
Amorce antisens : CTC CTC TCC TCT CCT CTT CCT (SEQ ID NO : 22 

ou : 

R represente A ou G, 
Y represente C ou T, 
N represente A, G, C ou T, 
I represente 1 ' inosine, 
H represente A, C ou T 

6. Procede de preparation de sequences nucleotidiques codant pour les chaines 
proteiques constituant la mol6cule d'hemoglobine 6*Arenicola marina^ a partir des 
amorces telles qu'obtenues selon le proced6 de la revendication 4, ledit procede etant 
caracteris6 en ce qu*il correspond a un proced6 d'amplification en chaine par 
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polym6rase (PGR), comprenant une repetition d'au moins 30 fois du cycle constitu6 par 
les etapes suivantes : 

* la denaturation, par chauffage, de I'ADNc monocatenaire codant pour xine 
des chaines prot^iques constituant la molecule d'hemoglobine d'Arenicola 
marina, de fafon a denaturer d'eventuelles structures secondaires et des reliquats 
d'ARN, ledit ADNc 6tant obtenu 4 partir d'ARNm, cette 6tape permettant 
d'obtenir des brins d'ADNc monocatenaires denatures, 

* rhybridation des couples d'amorces tels qu'obtenus par le proc6de tel que 
defini ci-dessus aux brins d'ADNc monocatenaires denatures susmentionnes a une 
temperature adequate, pour obtenir des amorces hybridees, et 

* la synthese du brin complementaire de I'ADNc par une polymerase k une 
temp6rature adequate, k partir des amorces hybridees telles qu'obtraues k Tdtape 
pr6c6dente. 

7. Proc6d6 de preparation selon la revendication 6, caracterise en ce que : 

- la premiere 6tape dudit proc6d6 est une 6tape de denaturation d*environ 10 
secondes k environ 5 minutes k ime temperature comprise d'environ 90^*0 a environ 
llO^C, 

- le cycle, repete environ 30 k 40 fois, comprend les etapes suivantes : 

* une etape de denaturation d*environ 10 secondes k environ 5 minutes, k une 
temperature comprise d'environ 90^C a environ 1 1 0*^0, 

* une etape d'hybridation d*environ 20 secondes a environ 2 minutes, k une 
temp6rature comprise d'environ 50*^0 i environ 60°C, et de preference 
d'environ SO'^C a environ 56^C, 

* une 6tape d'elongation d' environ 20 secondes a environ 1 minute et 30 
secondes, a une temperature comprise d 'environ TO'^C a environ 75°C, et 

- la demiere etape du precede est une etape d'elongation d'environ 5 minutes a 
environ 15 minutes a une temperature comprise d'environ 70°C a environ 75''C. 

8. Precede de preparation selon la revendication 6 ou 7, caracterise en ce que 
les couples d'amorces utilises sont tels que definis dans la revendication 5. 
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9, Proc6d6 de preparation selon la revendication 8, caracterise en ce que le 
couple d* amorces utilis6 est le suivant : (gar tgy ggn ccn ttr car cg ; ctc ctc 
Tcc TCT CCT CTT cct), R, Y et N etant tels que definis dans la revendication 5, 

ledit procedd 6tant caracteris6 en ce que : 

- la premiere etape du proc6d6 est une 6tape de d6naturation de 4 minutes a une 
temperature egale a 95^C, 

- le cycle, repet6 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale a 95°C, 

* une etape d'hybridation de 30 secondes a une temperature egale a 56*'C, 

* une etape d'elongation de 40 secondes a une temp6rature 6gale a 72°C, et 

- la demiere 6tape du proc6de est une 6tape d'61ongation de 10 minutes k une 
temperature egale a 72*'C, 

afin d'obtenir la sequence nucl6otidique SEQ ID NO : 13, 

ledit precede comprenant eventuellement ime etape supplementaire de 5* RACE 
PGR pour obtenir la sequence nucleotidique SEQ ID NO : 1. 

10. Procede de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant : (tgy ggn ath ctn car cg ; ctc ctc tcc 
TCT cct CTT cct), N, Y et R etant tels que definis dans la revendication 5, 

ledit procede etant caracterise en ce que : 

- la premiere etape du precede est une etape de denaturation de 4 minutes a ime 
temperature egale a 95®C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes a une temperature egale k 95^C, 

* une etape d'hybridation de 30 secondes a une temperature egale a 53'^C, 

* une etape d'elongation de 40 secondes a une temperature egale a 72°C, et 

- la derniere etape du precede est une etape d'elongation de 10 minutes a ime 
temperature egale a 72°C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 15, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PGR pour obtenir la sequence nucleotidique SEQ ID NO : 3. 



wo 2005/037392 PCT/FR2004/002602 

53 

11. Precede de preparation selon la revendication 8, caracterise en ce que le 
couple d' amorces utilise est le suivant : (aar gti aar can aac tgg ; ctc ctc tcc 
TCT CCT CTT cct), R, I et N 6tant tels que d6finis dans la revendication 5, 

ledit procedd 6tant caract£ris£ en ce que : 

- la premiere dtape du proc£d6 est une £tape de denaturation de 4 minutes k \me 
temp6rature 6gale k 95^C, 

- le cycle, repdte 35 fois, coraprend les etapes suivantes : 

* ime etape de denaturation de 1 minute a une temperature egale a 95 °C, 

* une etape d'hybridation de 1 minute a une temperature egale k SO'^C, 

* ime etape d'61ongation de 1 minute et 30 secondes i une temperature egale a 
72°C, et 

- la derniere 6tape du procede est une 6tape d'elbngation de 10 minutes a une 
temperature egale a 72*^C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 17, 

ledit procede comprenant eventuellement ime etape supplementaire de 5' RACE 
PGR pour obtenir la sequence nucleotidique SEQ ID NO : 5. 

12. Proc6d6 de pr6paration selon la revendication 8, caractdrise en ce que le 
couple d'amorces utilise est le suivant : (tgy tgy agy ath gar gay cg ; ctc ctc 
TCC TCT CCT CTT cct), Y, H et R 6tant tels que d6finis dans la revendication 5, 

ledit procede etant caracterise en ce que : > 

- la premiere 6tape du procede est une etape de denaturation de 4 minutes k une 
temperature egale a 95^C, 

- le cycle, repdte 35 fois, comprend les etapes suivantes : 

* une 6tape de denaturation de 30 secondes a une temperature egale a 95**C, 

* une etape d'hybridation de 40 secondes a ime temperature egale a 52°C, 

* une dtape d'elongation de 30 secondes a une temperature egale a 72^C, et 

- la derniere 6tape du procede est une etape d'61ongation de 10 minutes a une 
temperature 6gale a 72*^C, 

afin d'obtenir la sequence nucleotidique SEQ ID NO : 19, 

ledit procede comprenant eventuellement une etape supplementaire de 5' RACE 
PGR pour obtenir la sequence nucleotidique SEQ ID NO : 7. 
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13. Proced6 de preparation selon la revendication 8, caract^is6 en ce que le 
couple d'amorces utilise est le suivant : (aar gtn ath tty ggn agr ga; ctc ctc 
Tcc TCT OCT CTT cct), R, H, N et Y 6tant tels que d6finis dans la revendicatioH 5, 

ledit proc6d6 6tant caracteris6 en ce que : 

- la premiere etape du proced6 est une etape de denaturation de 4 minutes a una 
temp6rature egale a 95''C, 

- le cycle, repete 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 30 secondes i une temperature 6gale k 95°C, 

* une etape d*hybridation de 40 secondes a une temperature 6gale a 52^C, 

* une etape d'61ongation de 3Q secondes a une temperature egale a 72**C, et 

- la derniere etape du precede est une Stape d'61ongation de 10 minutes k une 
temperature egale a 72*'C, 

afin d'obtcnir une s6quence nucleotidique partielle de reference, 
ledit procede comprenant une 6tape suppl6mentaire de 5' RACE PGR pour 
obtenir la sequence nucleotidique SEQ ID NO : 9. 

14. Precede de preparation selon la revendication 8, caracterise en ce que le 
couple d'amorces utilise est le suivant : (gar cay car tgy ggn ggn ga, ctc ctc 
TCC TCT ccT CTT cct), R, N ct Y ctant tcls quc definis dans la revcndicatiou 5, 

ledit procede etant caracterise en ce que : 

- la premiere etape du procede est une etape de denaturation de 4 minutes a une 
temperature egale a 95**C, 

- le cycle, rep6t6 35 fois, comprend les etapes suivantes : 

* une etape de denaturation de 40 secondes a une temperature dgale a 95'*C, 

* une etape d 'hybridation de 1 minute a une temperature egale a 58^C, 

* une etape d'eiongation de 1 minute et 10 secondes k une temperature egale a 
72^C, et 

- la derniere 6tape du precede est ime etape d'eiongation de 10 minutes a une 
temperature egale a 72°C, 

afin d'obtenir une sequence nucleotidique partielle de reference, 
ledit procede comprenant une etape suppiementaire de 5' RACE PGR pour 
obtenir la sequence nucleotidique SEQ ID NO : 1 1 . 
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15. Prot6ines codSes par I'une des s6quences telles qu'obtenues selon le precede 
tel que defini dans Tune quelconque des revendications 6 a 14. 

16. Proteine selon la revendication 15, caract6risee en ce qu*elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 2, 

- ou toute sequence deriv^e de la sequence SEQ ID NO : 2 ou d'un fragment 
d6fini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette le transport de 
I'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 2 ou d'un fragment 
d^fmi ci-dessous, ayant de preference une homologie d*au moins environ 75%, avec la 
sequence SEQ ID NO : 2, sous reserve que ladite sequence homologue permette le 
transport de I'oxygene, 

- ou tout fragment d*une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment 6tant constitu6 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 2. 

17. Prot6ine selon la revendication 15, caracterisee en ce qu*elle comprend ou 
est constitute par : 

- la sequence SEQ ID NO : 4, 

- ou toute sequence d6rivee de la s6quence SEQ BD NO : 4 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve sous reserve que ladite sequence deriv6e permette le 
transport de I'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 4 ou d'un fragment 
ddfmi ci-dessous, ayant de pr6fi£rence une homologie d*au moins environ 75%, avec la 
sequence SEQ ID NO : 4, sous reserve que ladite sequence homologue permette le 
transport de Toxygfene, 

- ou tout fragment d*une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment 6tant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 4. 
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18. Proteine selon la revendication IS, caract£ris6e en ce qu'elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 6, 

- ou toute sequence derivee de la sequence SEQ ID NO : 6 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve sous reserve que ladite sequence derivee pennette le 
transport de Toxygfene, 

- ou toute sequence homologue de la s6quence SEQ ID NO : 6 ou d'un fragment 
d6fini ci-dessous, ayant de preference une homologie d*au moins environ 75%, avec la 
sequence SEQ ED NO : 6, sous reserve que ladite sequence homologue pcrmette le 
transport de Toxygfene, 

- ou tout fragment d*une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment 6tant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la s6quence SEQ ID NO : 6. 

19, Prot6ine selon la revendication 15, caract6risee en ce qu'elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 8, 

- ou toute sequence derivee de la sequence SEQ ID NO : 8 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence d6rivee pennette le transport de 
I'oxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 8 ou d'un fragment 
defini ci-dessous, ayant de preference une homologie d'au moins environ 75%, avec la 
sequence SEQ ID NO : 8, sous reserve que ladite sequence homologue permette le 
transport de Toxygfene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxygene, notamment tout fragment etant constitue 
d'au moins environ 60 acides amin6s, et notamment d'au moins environ 160 acides 
amines contigus dans la s6quence SEQ ID NO : 8. 
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20. Prot6ine selon la revendication 15, caract6ris6e en ce qu'elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 10, 

- ou toute sequence d6rivee de la sequence SEQ ID NO : 10 ou d'un jfragment 
d6fini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence d6riv6e permette le transport de 
Toxygene, 

- ou toute sequence homologue de la sequence SEQ ID NO : 10 ou d'un 
fragment defini ci-dessous, ayant de pr6f6rence une homologie d'au moins environ 
75%. avec la sequence SEQ ID NO i 10, sous reserve que ladite sequence homologue 
pemiette le transport de Toxygene, 

- ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette le transport de Toxyg^ne, notamment tout fragment etant constitue 
d'au moins environ 60 acides amines, et notamment d'au moins environ 160 acides 
amines contigus dans la sequence SEQ ID NO : 10. 

21. Proteine selon la revendication 15, caracteris6e en ce qu'elle comprend ou 
est constituee par : 

- la sequence SEQ ID NO : 12, 

- ou toute sequence d6riv6e de la sequence SEQ ID NO : 12 ou d'un fragment 
defini ci-dessous, notamment par substitution, suppression ou addition d'un ou plusieurs 
acides amines, sous reserve que ladite sequence derivee permette I'association des 
chames de globines entre elles, 

- ou toute sequence homologue de la sequence SEQ ID NO : 12 ou d'un 
fragment d6fini ci-dessous, ayant de pr6f6rence une homologie d'au moins environ 
75%, avec la sequence SEQ ID NO : 12, sous reserve que ladite sequence homologue 
permette Tassociation des chaines de globines entre elles, 

~ ou tout fragment d'une des sequences definies ci-dessus, sous reserve que ledit 
fragment permette I'association des chaines de globines entre elles, notamment tout 
fragment etant constitud d'au moins environ 60 acides amines, et notamment d'au 
moins environ 280 acides amines contigus dans la s6quence SEQ ID NO : 12. 

22. Sequences nucl6otidiques telles qu'obtenues selon le proc6de tel que defini 
dans Tune quelconque des revendications 6 a 14. 



wo 2005/037392 PCT/FR20O4/O02602 

58 

23. S6quences nucl6otidiques codant pour une prot6ine telle que definie dans 
Tune des revendications IS i 21. 



24. Sequence nucl6otidique selon la revendication 23, caract6risee en ce qu'elle 
comprend ou est constitute par : 

- la sequence nucleotidique SEQ ED NO : 1 codant pour SEQ ID NO : 2, 

- ou toute sequence nucleotidique deriv6e, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1, et codant pour une proteine representee par 
SEQ ID NO : 2, 

- ou toute sequence nucleotidique derivte, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 
codant pour une proteine derivee de SEQ ID NO : 2, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 1, ayant de 
preference une homologie d*au moins environ 60%, avec la sequence SEQ ID NO : 1, 

- ou tout fragment de la s6quence nucl6otidique SEQ ID NO : 1 ou des 
sequences nucl6otidiques d6finies ci-dessus, ledit fragment 6tant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique compl6mentaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'lme des sequences ou d'un des 
fragments susmentionnes. 

25. sequence nucleotidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 3 codant pour SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 3, et codant pour une proteine representee par 
SEQ ID NO : 4, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 3 
codant pour une proteine derivee de SEQ ID NO : 4, 
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- ou toute sequence nucl6otidique homologue de SEQ ID NO : 3, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 3, 

- ou tout fragment de la sequence nucltotidique SEQ ID NO : 3 ou des 
sequences nucleotidiques difinies ci-dessus, ledit fragment 6tant de preference constitu6 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionn^s, 

- ou toute sequence nucl6otidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

26. Sequence nucleotidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 5 codant pour SEQ ID NO : 6, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ED NO : 5, et codant pour une proteine representee par 
SEQ ID NO: 6, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 5 
codant pour une proteine derivee de SEQ ID NO : 6, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 5, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 5, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 5 ou des 
sequences nucleotidiques defmies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 
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27. Sequence nucleotidique selon la revendication 23, caract6risee en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucl6otidique SEQ ED NO : 7 codant pour SEQ ID NO : 8, 

- ou toute sequence nucl6otidique deriv6e, par degen6rescence du code 
g6n6tique, de la sequence SEQ ID NO : 7, et codant pour une proteine representee par 
SEQ ID NO : 8, 

- ou toute sequence nucleotidique d6riv6e, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 7 
codant pour une proteine derivee de SEQ ID NO : 8, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 7, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 7, 

- ou tout fragment de la sequence nucleotidique SEQ ID NO : 7 ou des 
sequences nucl6otidiques definies ci-dessus, ledit fragment 6tant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentionnes, 

- ou toute sequence nucleotidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d*ime des sequences ou d'un des 
fragments susmentionnes. 

28. sequence nucl6otidique selon la revendication 23, caracterisee en ce qu'elle 
comprend ou est constitute par : 

- la sequence nucleotidique SEQ ID NO : 9 codant pour SEQ ID NO : 10, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
g6netique, de la sequence SEQ ID NO : 9, et codant pour une proteine representee par 
SEQ ID NO: 10, 

- ou toute sequence nucleotidique derivee, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 9 
codant pour une proteine derivee de SEQ ID NO : 10, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 9, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 9, 
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- ou tout fragment de la sequence nucl6otidique SEQ ID NO : 9 ou des 
s6quences nucleotidiques d6finies ci-dessus, ledit fragment etant de pr6f6rence constitud 
d*au moins environ 180 nucleotides, et notamment d'au moins environ 480 nucleotides 
contigus dans ladite sequence, 

- ou toute sequence nucl^otidique compl6mentaire des sequences ou fragments 
susmentionnds, 

- ou toute sequence nucl6otidique susceptible d'hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

29. Sequence nucleotidique selon la revendication 23, caracteris6e. en ce qu'elle 
comprend ou est constituee par : 

- la sequence nucleotidique SEQ ID NO : 1 1 codant pour SEQ ID NO : 12, 

- ou toute sequence nucleotidique derivee, par degenerescence du code 
genetique, de la sequence SEQ ID NO : 1 1, et codant pour une prot^ine representee par 
SEQ ID NO : 12, 

- ou toute sequence nucleotidique deriv6e, notamment par substitution, 
suppression ou addition d'un ou plusieurs nucleotides, de la sequence SEQ ID NO : 1 1 
codant pour une proteine derivee de SEQ ED NO : 12, 

- ou toute sequence nucleotidique homologue de SEQ ID NO : 11, ayant de 
preference une homologie d'au moins environ 60%, avec la sequence SEQ ID NO : 1 1, 

- ou tout fragment de la s&juence nucleotidique SEQ ID NO: 11 ou des 
sequences nucleotidiques definies ci-dessus, ledit fragment etant de preference constitue 
d'au moins environ 180 nucleotides, et notamment d'au moins environ 800 nucleotides 
contigus dans ladite sequence, 

~ ou toute sequence nucleotidique complementaire des sequences ou fragments 
susmentioimes, 

- ou toute sequence nucleotidique susceptible d*hybrider dans des conditions 
stringentes avec la sequence complementaire d'une des sequences ou d'un des 
fragments susmentionnes. 

30. Procede de preparation selon la revendication 6, de sequences 
nucleotidiques codant pour les chaines proteiques constituant la molecule 
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ci'h6inoglobine d'Aiin^lides, notamment d'Arenicola marina, ledit precede etant 
caract6ris6 en ce qu'il comprend les Stapes suivantes : 

- une 6tape de raise en pr6sence de la molecule d'h6moglobine susmentionnee 
avec au moins un agent dissociant et un agent rSducteur, notamment un mSlange 
constitue de dithiothreitol (DTT) ou de chlorhydrate de tris(2-carboxyethyl)phosphine 
(TCEP) ou de beta-mercaptoethanol et d'un tampon de dissociation, pendant un temps 
suffisant pour separer les chaines proteiques les unes des autres> 

permettant la dissociation, puis la reduction, de ladite molecule d'hemoglobine, 
afin d'obtenir les chaines proteiques constituant ladite molecule, 

- I'isolement de chacune des chaines proteiques susmentionnees, 

- le microsequenfage par spectrometrie de masse et le sequenfage d'Edman de 
chacune des chaines proteiques isolees susmentionn6es, afin d'obtenir une 
micros6quence correspondant k chacune des sequences constitutes de 5 a 20 acides 
amines, 

- la determination des couples d'amorces degener6es k partir des micros6quences 
susmentionnees, 

- la preparation des sdquences nucleotidiques codant pour les chaines proteiques 
susmentionnees, a partir des amorces telles qu'obtenues pr6c6demment, par un precede 
d'amplification en chaine par polymerase (PGR), comprenant les 6tapes suivantes ; 

- la premiere etape dudit proced6 est une etape de d6naturation d'environ 10 
secondes k environ 5 minutes k une temperature comprise d*environ 90°C a environ 
llO^C, 

- le cycle, rep6t6 environ 30 a 40 fois, comprend les etapes suivantes : 

* une etape de dSnaturation d"environ 10 secondes k environ 5 minutes, a une 
temperature comprise d* environ 90°C a environ 1 lO^C, 

* une etape d'hybridation d'environ 20 secondes k environ 2 minutes, a une 
temperature comprise d'environ 50°C k environ 56°C, 

* une etape d'eiongation d*environ 20 secondes a environ 1 minute et 30 
secondes, k une temperature comprise d'environ 70°C a environ 75°C, et 

- la demifere 6tape du procede est une etape d'eioigation d'environ 5 minutes a 
environ 15 minutes a une temperature comprise d'environ 70°C a environ TS^'C. 
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<160> 31 

<170> PatentIn version 3.1 

<210> 1 

<211> 474 

<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1)..(474) 

<223> 

<400> 1 

atg aag tec ttg gtg gtt ctg ttc gcc ctg gtg gcc atg gtg get gca 48 

Met Lys Ser Leu Val Val Leu Phe Ala Leu Val Ala Met Val Ala Ala 
15 10 15 

gag tgc ggc ccc atg cag cgc etc ctg gtc aag acc cag tgg aac aag 96 
Glu Cys Gly Pro Met Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys 
20 25 30 

gtg tac ggc acc ago aag gtc agg gac gag gcc gga cac gtc etc tgg 144 
Val Tyr G^ly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp 
35 40 45 

aag get att ttc gcc cag gat ccc gag acc egg get etc ttc aag aga 192 
Lys Ala lie Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg 
50 55 60 

gtc aac ggt gac gac ate tac tet ccc gag ttc atg get cac age gcc 240 
Val Asn Gly Asp Asp lie Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 70 75 80 

cgt gtc ttg ggt ggc ett gac att gcc ate tec etc etc gac aac cag 288 
Arg Val Leu Gly Gly Leu Asp lie Ala lie Ser Leu Leu Asp Asn Gin 
85 90 95 

get gac ett gac gtc gee ctg get cac ctt cac gtg cag cac gta gaa 336 
Ala Asp Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu 
100 105 110 

agg cac ate cea acc cgc tac ttc gat ctg ttc aag aac gee ctg atg 384 
Arg His lie Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met 
115 120 125 
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gag tat gcc 
Glu Tyr Ala 
130 


ccc 
Pro 


age 
Ser 


gcc 
Ala 


ctg 
Leu 
135 


gga cgc tgc 
Gly Arg Cys 


ttc 
Phe 


gat 
Asp 
140 


aag 
Lys 


acc 
Thr 


gee 
Ala 


tgg 
Trp 


age teg tgc 
Ser Ser Cys 
145 


ttt 
Phe 


gae 
Asp 


gtc 
Val 
150 


ate 
He 


gcc aac 
Ala Asn 


ggc 
Gly 


ate 
He 
155 


aag 
Lys 


gaa 
Glu 


tag 






<210> 2 
<211> 157 
<212> PRT 

<213> Arenicola marina 




















<400> 2 
Met Lys Ser 
1 


Leu 


Val 
5 


Val 


Leu 


Phe Ala 


Leu 
10 


Val 


Ala 


Met 


Val 


Ala 
15 


Ala 


Glu Cys Gly 


Pro 
20 


Met 


Gin 


Arg 


Leu Leu 
25 


Val 


Lys 


Thr 


Gin 


Trp Asn 

30 


Lys 


Val Tyr Gly 
35 


Thr 


Ser 


Lys 


Val 


40 


Glu 


Ala 


Gly 


His 
45 


Val 


Leu 


Trp 


Lys Ala He 
50 


Phe 


Ala 


Gin 


Asp 
55 


rro uxu 


X nr 


Arg Ala 
60 


Leu 


Phe 


Lys 


Arg 


Val Asn Gly 
65 


Asp Asp 


He 
70 


Tyr 


Ser Pro 


Glu 


Phe 
75 


Met 


Ala 


His 


Ser 


Ala 
80 


Arg Val Leu 


Gly 


Gly 
85 


Leu 


Asp 


He Ala 


He 
90 


Ser 


Leu 


Leu 


Asp 


Asn 
95 


Gin 


Ala Asp Leu 


Asp 
100 


Val 


Ala 


Leu 


Ala His 
105 


Leu 


His 


Val 


Qi J.n 


His 
110 


Val 


Glu 


Arg His He 
115 


Pro 


Thr 


Arg 


Tyr 


Phe Asp 
120 


Leu 


Phe 


Lys 


Asn 
125 


Ala 


Leu 


Met 


Glu Tyr Ala 
130 


Pro 


Ser 


Ala 


Leu Gly Arg Cys 
135 


Phe Asp 
140 


Lys 


Thr 


Ala 


Trp 


Ser Ser Cys 
145 


Phe 


Asp 


Val 
150 


He 


Ala Asn 


Gly 


He 
155 


Lys 


Glu 









432 



474 



<210> 


3 


<211> 


477 


<212> 


ADN 


<213> 


Arenicola marina 


<220> 




<221> 


CDS 


<222> 


(1) . . (477) 


<223> 




<400> 


3 



atg aag ttc ttg gtg gtt ctg ttc gee ctg gtg gee atg gtc get get 48 
Met Lys Phe Leu Val Val Leu Phe Ala Leu Val Ala Met Val Ala Ala 
15 10 15 
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gat tgt ggc ccc atg cag cgc etc ctg gtc aag gcc cag tgg aac aag 96 
Asp Cys Gly Pro Met Gin Arg Leu Leu Val Lys Ala Gin Trp Asn Lys 
20 25 30 

gtg tac ggc acc age aag gtc agg gac gac gcc gga cac gtc etc tgg 144 
Val Tyr Gly Thr Ser Lys Val Arg Asp Asp Ala Gly His Val Leu Trp 
35 40 45 

aag get ate ttc aac cag gat ggt gag acc cgc gcc etc "ttc aac aga 192 
Lys Ala lie Phe Asn Gin Asp Gly Glu Thr Arg Ala Leu Phe Asn Arg 
50 55 60 

gtg cac ggt gac gac ate tac tet ccc gag ttc atg get eac age gcc 240 
Val His Gly Asp Asp lie Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 70 75 80 

cgt gtc ttg ggt ggc ctt gae att gcc ate tec etc etc gae aae cag 288 
Arg Val Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin 
85 90 95 

get gag ctt gac get gtc ctg get cac etc aag gag cag cac att gag 336 
Ala Glu Leu Asp Ala Val Leu Ala His Leu Lys Glu Gin His He Glu 
100 105 110 

agg ggg ate eca gac cgt tac ttc gac ctg ttc aag aae gee ctg atg 384 
Arg Gly He Pro Asp Arg Tyr Phe Asp Leu Phe Lys Asn .Ala Leu Met 
115 120 125 

gag ttt gcc ccc age gee ttg gga cgc tgc ttc ata aag gae get tgg 432 
Glu Phe Ala Pro Ser Ala Leu Gly Arg Cys Phe He Lys Asp Ala Trp 
130 135 140 

age tea tgc ttt gac gtc att gee aac ggc ate aag gga cag taa 477 
Ser Ser Cys Phe Asp Val He Ala Asn Gly He Lys Gly Gin 
145 150 155 

<210> 4 

<211> 158 

<212> PRT 

<213> Arenicola marina 

<400> 4 

Met Lys Phe Leu Val Val Leu Phe Ala Leu Val Ala Met Val Ala Ala 
1 5 10 . 15 

Asp Cys Gly Pro Met Gin Arg Leu Leu Val Lys Ala Gin Trp Asn Lys 
20 25 30 

Val Tyr Gly Thr Ser Lys Val Arg Asp Asp Ala Gly His Val Leu Trp 
35 40 45 

Lys Ala He Phe Asn Gin Asp Gly Glu Thr Arg Ala Leu Phe Asn Arg 
50 55 60 

Val His Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala 
65 70 75 80 

Arg Val Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin 
85 90 95 
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Ala Glu Leu Asp Ala Val Leu Ala His Leu Lys Glu Gin His lie Glu 
100 105 110 

Arg Gly He Pro Asp Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met 
115 120 125 

Glu Phe Ala Pro Ser Ala Leu Gly Arg Cys Phe lie Lys Asp Ala Trp 
130 135 140 

Ser Ser Cys Phe Asp Val He Ala Asn Gly He Lys Gly Gin 
145 150 155 



<210> 5 

<211> 474 

<212> ADN 

<213> Arenicola marina 

<220> 

<221> CDS 

<222> (1)..(474) 

<223> 

<400> 5 

atg aag gtc ctg ate gta ctg atg gcc tgc ttg gcc tac gtc gcc gcc 48 

Met Lys Val Leu He Val Leu Met Ala Cys Leu Ala Tyr Val .Ala Ala 
15 10 15 

gac tgc gga cct ctg cag agg ctg aag gtg aag cat cag tgg gtg cag 96 
Asp Cys Gly Pro Leu Gin Arg Leu Lys Val Lys His Gin Trp Val Gin 
20 25 30 

gtg tac age ggc eat ggt tac gag cgt gag gcg ttc ggc aga gag gtc 14 4 

Val Tyr Ser Gly His Gly Tyr Glu Arg Glu Ala Phe Gly Arg Glu Val 
35 40 45 

ttc etc gag atg tac aac cag gea ccc aag gcc aag gac etc ttc acc 192 
Phe Leu Glu Met Tyr Asn Gin Ala Pro Lys Ala Lys Asp Leu Phe Thr 
50 55 60 

agg gtc agg ggc gag aac gtc ttc tec ccc gag ttc gga gcc cac atg 240 
Arg Val Arg Gly Glu Asn Val Phe Ser Pro Glu Phe Gly Ala His Met 
65 70 75 80 

gtc cgt gtg etc gga gga etc gac atg tgc ate get ctg ctg tec gat 288 
Val Arg Val Leu Gly Gly Leu Asp Met Cys He Ala Leu Leu Ser Asp 
85 90 95 

gac acc gtc etc aac gee cag ett get cac etc age aeg cag cac aag 336 
Asp Thr Val Leu Asn Ala Gin Leu Ala His Leu Ser Thr Gin His Lys 
100 105 110 

gac cgt gga ate ccc aac gag tac ttc gat gtg atg aag gtc gee etc 384 
Asp Arg Gly He Pro Asn Glu Tyr Phe Asp Val Met Lys Val Ala Leu 
115 120 125 

atg aag gtc gtc ccc ggc eac gtt tea cac ttc gac ttc gat gcc tgg 432 
Met Lys Val Val Pro Gly His Val Ser His Phe Asp Phe Asp Ala Trp 
130 135 140 
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tct gcc tgc tat gac gtc ate gcc aac ggc ate aag cac taa 474 
Ser Ala Cys Tyr Asp Val lie Ala Asn Gly lie Lys His 
145 150 155 



<210> 6 

<211> 157 

<212> PRT 

<213> Arenicola marina 

<400> 6 

Met Lys Val Leu lie Val Leu Met Ala Cys Leu Ala Tyr Val Ala Ala 
1 5 10 . 15 

Asp Cys Gly Pro Leu Gin Arg Leu Lys Val Lys His Gin Trp Val Gin 
20 25 30 

Val Tyr Ser Gly His Gly Tyr Glu Arg Glu Ala Phe Gly Arg Glu Val 
35 40 45 

Phe Leu Glu Met Tyr Asn Gin Ala Pro Lys Ala Lys Asp Leu Phe Thr 
50 55 60 

Arg Val Arg Gly Glu Asn Val Phe Ser Pro Glu Phe Gly Ala His Met 
65 70 75 80 

Val Arg Val Leu Gly Gly Leu Asp Met Cys lie Ala Leu Leu Ser Asp 
85 90 95 

Asp Thr Val Leu Asn Ala Gin Leu Ala His Leu Ser Thr Gin His Lys 
100 105 110 

Asp Arg Gly lie Pro Asn Glu Tyr Phe Asp Val Met Lys Val Ala Leu 
115 120 125 

Met Lys Val Val Pro Gly His Val Ser His Phe Asp Phe Asp Ala Trp 
130 135 140 

Ser Ala Cys Tyr Asp Val lie Ala Asn Gly lie Lys His 
145 150 155 



<210> 7 

<211> 498 

<212> ADN 

<213> Arenicola marina 



<220> 

<221> CDS 

<222> (1),.(498) 

<223> 



<400> 7 

atg ctt egt ttc gta gca cte ttg get ctg gte ggc ctg gcc gtc tgt 48 

Met Leu Arg Phe Val Ala Leu Leu Ala Leu Val Gly Leu Ala Val Cys 

15 10 15 



gac gac tgt tgt acc acc gag gac cgc aag gag gtc cag acg ctg tgg 96 
Asp Asp Cys Cys Thr Thr Glu Asp Arg Lys Glu Val Gin Thr Leu Trp 
20 25 30 
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agt gag ate tgg agt gcc cag ttc act ggt cgc cgt gtc cag gtt gcc 144 

Ser Glu lie Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala 
35 40 45 

cag get gtg ttc gag gac etc ttc cgc cgc gac ccc gag tec aag aac 192 
Gin Ala Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn 
50 55 60 

ctg ttc aag cgc gtc aat gtt gac gac atg aac age ccc gaa ttc cae 240 
Leu Phe Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His 
65 70 75 80 

get cac tge ate cgt gtt gtc aac ggt ctt gac acc gtg ate ggt etc 288 
Ala His Cys lie Arg Val Val Asn Gly Leu Asp Thr Val lie Gly Leu 
85 90 95 

ctt gac gac ccc gac acc ctg aag tec cag etc gag cac ttg gcc cag 336 
Leu Asp Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin 
100 105 110 

cag cae aag gag cgt gat ggc ate cac aag acc cac ttc gac gag atg 384 
Gin His Lys Glu Arg Asp Gly lie His Lys Thr His Phe Asp Glu Met 
115 120 125 

tec cac gee ttc ggc gcc gtc atg ccc cag gtc age age tge ttc aac 432 
Ser His Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn 
130 135 140 

ccc gat gcc tgg aac cgt tge ttc ggc tec ate get acc aag att get 4 80 

Pro Asp Ala Trp Asn Arg Cys Phe Gly Ser lie Ala Thr Lys lie Ala 
145 150 155 160 

tec etc etc gag gat taa 4 98 

Ser Leu Leu Glu Asp 
165 

<210> 8 
<211> 165 
<212> PRT 

<213> Arenicola marina 
<400> 8 

Met Leu Arg Phe Val Ala Leu Leu Ala Leu Val Gly Leu Ala Val Cys 
1 5 10 15 

Asp Asp Cys Cys Thr Thr Glu Asp Arg Lys Glu Val Gin Thr Leu Trp 
20 25 30 

Ser Glu lie Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala 
35 40 45 

Gin Ala Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn 
50 55 60 

Leu Phe Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His 
65 70 75 80 

Ala His Cys lie Arg Val Val Asn Gly Leu Asp Thr Val lie Gly Leu 
85 90 95 
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Leu Asp Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu 
100 105 110 

Gin His Lys Glu Arg Asp Gly lie His Lys Thr His Phe Asjp 
115 120 125 

Ser His Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys 
130 135 140 

Pro Asp Ala Trp Asn Arg Cys Phe Gly Ser lie Ala Thr Lys 
145 150 155 

Ser Leu Leu Glu Asp 
165 



<210> 9 

<211> 498 

<212> ADN 

<213> Arenicola marina 

<220> 

<221> CDS 

<222> (1) . . (498) 
<223> 

<400> 9 

atg atg tec gtc gtg ttc etc etc ggc ctt gtg gee tac gcc tee gee 48 

Met Met Ser Val Val Phe Leu Leu Gly Leu Val Ala Tyr Ala Ser Ala 

1 5 10 . 15 

tec age tge tgc tec tat gga gae cag cag aag gtc aag gcc cag tgg 96 
Ser Ser Cys Cys Ser Tyr Gly Asp Gin Gin Lys Val Lys Ala Gin Trp 
20 25 30 

aac age etc tgg aac acc cct gac tec tec aca tec aag ate ate ttc 144 
Asn Ser Leu Trp Asn Thr Pro Asp Ser Ser Thr Ser Lys lie He Phe 
35 40 45 

gga aag gaa gtc ttc gca cge ttc ttc gag gtt gac ccc gag age aag 192 
Gly Lys Glu Val Phe Ala Arg Phe Phe Glu Val Asp Pro Glu Ser Lys 
50 55 60 
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Ala Gin 

Glu Met 

Phe Asn 

He Ala 
160 



age ctg ttc ggt cge gtc aag gtt gaa 

Ser Leu Phe Gly Arg Val Lys Val Glu 

65 70 

gcc gga cac gtg ate cgt gtt ttg acc 

Ala Gly His Val He Arg Val Leu Thr 
85 

ttg atg ggt gac gat gcc atg gat gcc 

Leu Met Gly Asp Asp Ala Met Asp Ala 

100 105 



gac ccc gac age ccc gag ttc 240 
Asp Pro Asp Ser Pro Glu Phe 
75 80 

ggt ctg gat ttg ate ate aac 288 
Gly Leu Asp Leu He He Asn 
90 95 

gag ctg gee cac ctt aac acc 336 
Glu Leu Ala His Leu Asn Thr 
110 



cag cat ttg gcc aga gag gga ate acc gga acc cac ttc acc gag atg 384 
Gin His Leu Ala Arg Glu Gly He Thr Gly Thr His Phe Thr Glu Met 
115 120 125 
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ttc aag gtc ctg gat gga tec etc cgc 

Phe Lys Val Leu Asp Gly Ser Leu Arg 
130 135 

tec ctg tec tgg agg tac tgc ttc cgt 

Ser Leu Ser Trp Arg Tyr Cys Phe Arg 
145 150 

gat ggt etc cec gca taa 

Asp Gly Leu Pro Ala 
165 
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cag gtt etc gag gag tac gat 432 
Gin Val Leu Glu Glu Tyr Asp 
140 

ggt ctg ggc gee gee etc agg 4 80 

Gly Leu Gly Ala Ala Leu Arg 
155 160 

498 



<210> 10 

<211> 165 

<212> PRT 

<213> Arenicola marina 

<400> 10 

Met Met Ser Val Val Phe Leu Leu Gly Leu Val Ala Tyr Ala Ser Ala 

1 .5 10 .15 

Ser Ser Cys Cys Ser Tyr Gly Asp Gin Gin Lys Val Lys Ala Gin Trp 
20 25 30 

Asn Ser Leu Trp Asn Thr Pro Asp Ser Ser Thr Ser Lys lie lie Phe 
35 40 45 

Gly Lys Glu Val Phe Ala Arg Phe Phe Glu Val Asp Pro Glu Ser Lys 
50 55 60 

Ser Leu Phe Gly Arg Val Lys Val Glu Asp Pro Asp Ser Pro Glu Phe 
65 70 75 80 

Ala Gly His Val He Arg Val Leu Thr Gly Leu Asp Leu He He Asn 
85 90 95 

Leu Met Gly Asp Asp Ala Met Asp Ala Glu Leu Ala His Leu Asn Thr 
100 105 110 

Gin His Leu Ala Arg Glu Gly He Thr Gly Thr His Phe Thr Glu Met 
115 120 125 

Phe Lys Val Leu Asp Gly Ser Leu Arg Gin Val Leu Glu Glu Tyr Asp 
130 135 140 

Ser Leu Ser Trp Arg Tyr Cys Phe Arg Gly Leu Gly Ala Ala Leu Arg 
145 150 155 160 

Asp Gly Leu Pro Ala 
165 



<210> 11 

<211> 771 

<212> ADN 

<213> Arenicola marina 



<220> 

<221> CDS 



wo 2005/037392 PCT/FR2004/002602 

9/19 

<222> (1)..(771) 
<223> 

<400> 11 

atg aag age tac gtg etc gtg tgc tgc etc gtg gtg ggg gcc gtg gcc 48 

Met Lys Ser Tyr Val Leu Val Cys Cys Leu Val Val Gly Ala Val Ala 
15 10 15 

tac ccc cac gag gtg atg cac cat gcc gtt ggc gca aac cga atg tgc 96 
Tyr Pro His Glu Val Met His His Ala Val Gly Ala Asn Arg Met Cys 
20 25 30 

aag tgt gat gcc cog gca ggg aac gcc gaa acc tec gcc gac aga gag 14 4 

Lys Cys Asp Ala Pro Ala Gly Asn Ala Glu Thr Ser Ala Asp Arg Glu 
35 40 45 

cag agt cac act etc gat gag ttg acc cat cag ttg cac atg ctg cag 192 
Gin Ser His Thr Leu Asp Glu Leu Thr His Gin Leu His Met Leu Gin 
50 55 60 

caa gcc tac gac acc ggc atg ggt cgt gtc gat gac gtg atg gag gac 240 
Gin Ala Tyr Asp Thr Gly Met Gly Arg Val Asp Asp Val Met Glu Asp 
65 70 75 80 

atg gac gac ctg tec cac agg ate gcc gac cac gag aag gaa cac tgt 288 
Met Asp Asp Leu Ser His Arg lie Ala Asp His Glu Lys Glu His Cys 

85 90 95 . 

aag aag tat aga gag ttc cag tgc ggt ggt gac cat cca aag tgc ate 336 
Lys Lys Tyr Arg Glu Phe Gin Cys Gly Gly Asp His Pro Lys Cys lie 
100 105 110 

teg aac etc etc gtc tgc gac ggt gac aac gac tgt gac aat gga get 384 
Ser Asn Leu Leu Val Cys Asp Gly Asp Asn Asp Cys Asp Asn Gly Ala 
115 120 125 

gat gag get cgt tgt gat gtg etc acc gag get ggt agt agt tgg act 432 
Asp Glu Ala Arg Cys Asp Val Leu Thr Glu Ala Gly Ser Ser Trp Thr 
130 135 140 

ggt act gtg gtc tac gat cac tgc acc aag cgt cgc cca gag acc atg 480 
Gly Thr Val Val Tyr Asp His Cys Thr Lys Arg Arg Pro Glu Thr Met 
145 150 ■ 155 160 

aag etc age ate aag age gtg gat acc gta ccc ttc ttc acc acc cac 528 
Lys Leu Ser lie Lys Ser Val Asp Thr Val Pro Phe Phe Thr Thr His 
165 170 175 

ccc aag gtc cgc ggt acc gtg ctt atg gag aag cac acc aag gac tac 57 6 

Pro Lys Val Arg Gly Thr Val Leu Met Glu Lys His Thr Lys Asp Tyr 
180 185 190 

age gag gtc ate aac gag ccg gtc tet ggc tac tgg age age gcc gat 624 
Ser Glu Val He Asn Glu Pro Val Ser Gly Tyr Trp Ser Ser Ala Asp 
195 200 205 

agg age gcc get atg ccc ccg gac age gcc ggt cac ctt ggc ttt gtc 672 
Arg Ser Ala Ala Met Pro Pro Asp Ser Ala Gly His Leu Gly Phe Val 
210 215 220 
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tgc ate ttc cac ggc cac gac cac gac acc tgc act ggt etc etc ace 720 

Cys He Phe His Gly His Asp His Asp Thr Cys Thr Gly Leu Leu Thr 

225 230 235 240 

aag ggc aag gtc aca gat gee tgc gcc gag ttc acc ttc cac agg gat 7 68 

Lys Gly Lys Val Thr Asp Ala Cys Ala Glu Phe Thr Phe His Arg Asp 
245 250 255 

taa- 771 



<210> 12 

<211> 256 

<212> PRT 

<213> Arenicola marina 

<400> 12 

Met Lys Ser Tyr Val Leu Val Cys Cys Leu Val Val Gly Ala Val Ala 
1 5 10 15 

Tyr Pro His Glu Val Met His His Ala Val Gly Ala Asn Arg Met Cys 
20 25 30 

Lys Cys Asp Ala Pro Ala Gly Asn Ala Glu Thr Ser Ala Asp Arg Glu 
35 40 45 

Gin Ser His Thr Leu Asp Glu Leu Thr His Gin Leu His Met Leu Gin 
50 55 60 

Gin Ala Tyr Asp Thr Gly Met Gly Arg Val Asp Asp Val Met Glu Asp 
65 70 75 80 

Met Asp Asp Leu Ser His Arg He Ala Asp His Glu Lys Glu His Cys 
85 90 95 

Lys Lys Tyr Arg Glu Phe Gin Cys Gly Gly Asp His Pro Lys Cys He 
100 105 110 

Ser Asn Leu Leu Val Cys Asp Gly Asp Asn Asp Cys Asp Asn Gly Ala 
115 120 125 

Asp Glu Ala Arg Cys Asp Val Leu Thr Glu Ala Gly Ser Ser Trp Thr 
130 135 140 

Gly Thr Val Val Tyr Asp His Cys Thr Lys Arg Arg Pro Glu Thr Met 
145 150 155 160 

Lys Leu Ser He Lys Ser Val Asp Thr Val Pro Phe Phe Thr Thr His 
165 170 175 

Pro Lys Val Arg Gly Thr Val Leu Met Glu Lys His Thr Lys Asp Tyr 
180 185 190 

Ser Glu Val He Asn Glu Pro Val Ser Gly Tyr Trp Ser Ser Ala Asp 
195 200 205 

Arg Ser Ala Ala Met Pro Pro Asp Ser Ala Gly His Leu Gly Phe Val 
210 215 220 



Cys He Phe His Gly His Asp His Asp Thr Cys Thr Gly Leu Leu Thr 
225 230 235 240 
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Lys Gly Lys Val Thr Asp Ala Cys Ala Glu , Phe Thr Phe His Arg Asp 
245 250 255 

<210> 13 
<211> 376 
<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1)..(375) 

<223> 

<400> 13 

gga cct ttg cag cgc etc ctg gtc aag acc cag tgg aac aag gtg tac 4 8 

Gly Pro Leu Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys Val Tyr 
15 10 15 

ggc acc age aag gtc agg gac gag gcc gga cac gtc etc tgg aag get 96 
Gly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp Lys Ala 
20 25 30 

att ttc gcc cag gat ccc gag acc egg get etc ttc aag aga gtc aac 14 4 

He Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg Val Asn 
35 40 45 

ggt gac gac ate tac tct ccc gag ttc atg get cac age gcc cgt gtc 192 
Gly Asp Asp He Tyr Ser Pro Glu Phe Met Ala His Ser Ala Arg Val 
50 55 60 

ttg ggt ggc ctt gac att gcc ate tec etc etc gac aac cag get gac 24 0 

Leu Gly Gly Leu Asp lie Ala He Ser Leu Leu Asp Asn Gin Ala Asp 
65 70 75 80 

ctt gac gtc gcc ctg get cac ctt cac gtg cag cac gta gaa agg cac 288 
Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu Arg His 
85 90 95 

ate eca acc cgc tac ttc gat ctg ttc aag aac gee ctg atg gag tat 336 
He Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met Glu Tyr 
100 105 110 

gcc ccc age gee ctg gga cgc tgc ttt gat aag gac gca t 376 
Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Asp Ala 
115 120 125 

<210> 14 
<211> 125 
<212> PRT 

<213> Arenicola marina 
<400> 14 

Gly Pro Leu Gin Arg Leu Leu Val Lys Thr Gin Trp Asn Lys Val Tyr 
15 10 15 

Gly Thr Ser Lys Val Arg Asp Glu Ala Gly His Val Leu Trp Lys Ala 
20 25 30 
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He Phe Ala Gin Asp Pro Glu Thr Arg Ala Leu Phe Lys Arg Val Asn 

35 40 45 

Gly Asp Asp lie Tyr Ser Pro Glu Phe Met Ala His Ser Ala Arg Val 
50 55 60 

Leu Gly Gly Leu Asp He Ala He Ser Leu Leu Asp Asn Gin Ala Asp 
65 70 75 80 

Leu Asp Val Ala Leu Ala His Leu His Val Gin His Val Glu Arg His 
85 90 95 

He Pro Thr Arg Tyr Phe Asp Leu Phe Lys Asn Ala Leu Met Glu Tyr 
100 105 110 

Ala Pro Ser Ala Leu Gly Arg Cys Phe Asp Lys Asp Ala 
115 120 125 



<210> 


15 


<211> 


288 


<212> 


ADN 


<213> 


Arenicola marina 


<220> 




<221> 


CDS 


<222> 


(1) . . (288) 


<223> 





<400> 15 

tgc gga ccc ctt cag cgc ctg aag gtc aag cgc cag tgg get gag get 

Cys Gly Pro Leu Gin Arg Leu Lys Val Lys Arg Gin Trp Ala Glu Ala 

1 5 10 15 

tat gga age gga aac age agg gag gaa ttc gga cac ttc ate tgg tee 
Tyr Gly Ser Gly Asn Ser Arg Glu Glu Phe Gly His Phe He Trp Ser 
20 25 30 

cat gtc ttc cag cae teg cct get gee cge gac atg ttc aag egc gte 
His Val Phe Gin His Ser Pro Ala Ala Arg Asp Met Phe Lys Arg Val 
35 40 45 

ege ggt gac aac ate cac ace eea gca ttc atg gee cae gee acc egt 
Arg Gly Asp Asn He His Thr Pro Ala Phe Met Ala His Ala Thr Arg 
50 55 60 

gtg etc ggt gga etc gac atg tgc att gee ctt cte gat gat gaa ccc 240 
Val Leu Gly Gly Leu Asp Met Cys He Ala Leu Leu Asp Asp Glu Pro 
65 70 75 80 

gtt etg aac aeg cag etc get cat ctt gee aag caa cac gaa ace egt 288 
Val Leu Asn Thr Gin Leu Ala His Leu Ala Lys Gin His Glu Thr Arg 
85 90 95 



<210> 16 

<211> 96 

<212> PRT 

<213> Arenicola marina 



96 



144 



192 
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<400> 16 

Cys Gly Pro Leu Gin Arg Leu Lys Val Lys Arg Gin Trp Ala Glu Ala 
1 5 10 15 

Tyr Gly Ser Gly Asn Ser Arg Glu Glu Phe Gly His Phe lie Trp Ser 
20 25 30 

His Val Phe Gin His Ser Pro Ala Ala Arg Asp Met Phe Lys Arg Val 
35 40 45 

Arg Gly Asp Asn lie His Thr Pro Ala Phe Met Ala His Ala Thr Arg 
50 55 60 

Val Leu Gly Gly Leu Asp Met Cys lie Ala Leu Leu Asp Asp Glu Pro 

65 70 75 80 

Val Leu Asn Thr Gin Leu Ala His Leu Ala Lys Gin His Glu Thr Arg 
85 90 95 



<210> 


17 


<211> 


360 


<212> 


ADN 


<213> 


Arenicola marina 


<220> 




<221> 


CDS 


<222> 


(1) . . (360) 


<223> 




<400> 


17 


aag gtg 


aag cac caa tgg 


Lys Val 


Lys His Gin Trp 


1 


5 



10 15 



48 



cgt gag gcg ttc ggc aga gag gtc ttc etc gag atg tac aac cag gca 96 
Arg Glu Ala Phe Gly Arg Glu Val Phe Leu Glu Met Tyr Asn Gin Ala 
20 25 30 

ccc aag gcc aag gac etc ttc acc agg gtc agg ggc gag aac gtc ttc 144 
Pro Lys Ala Lys Asp Leu Phe Thr Arg Val Arg Gly Glu Asn Val Phe 
35 40 45 

tec ccc gag ttc gga gcc cac atg gtc cgt gtg etc gga ggt etc gac 192 
Ser Pro Glu Phe Gly Ala His Met Val Arg Val Leu Gly Gly Leu Asp 
50 55 60 

atg tgc ate get ctg ctg tec gat gac acc gtc etc aac gcc cag ctt 24 0 

Met Cys lie Ala Leu Leu Ser Asp Asp Thr Val Leu Asn Ala Gin Leu 
65 70 75 80 

get cac etc age aeg cag cac aag gac cgt gga ate ccc aac gag tac 288 
Ala His Leu Ser Thr Gin His Lys Asp Arg Gly lie Pro Asn Glu Tyr 
85 90 95 

ttc gat gtg gtg aag gtc gcc etc atg aag gtc gtc ccc ggc cac gtt 336 
Phe Asp Val Val Lys Val Ala Leu Met Lys Val Val Pro Gly His Val 
100 105 110 
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tea cac ttc gat ate ggc gcg tgg 360 



Ser His Phe 
115 


Asp 


He Gly 


Ala 


Trp 
120 


















<210> 18 
<211> 120 
<212> PRT 

<213> Arenicola marina 






















<400> 18 
Lys Val Lys 
1 


His 


Gin Trp 
5 


Val 


Gin 


Val 


Tyr 
10 


Ser 


Gly 


His 


Gly 


Tyr 
15 


Glu 


Arg Glu Ala 


Phe 
20 


Gly Arg Glu Val 


Phe 
25 


Leu 


Glu 


Met 


Tyr 


Asn 
30 


Gin 


Ala 


Pro Lys Ala 
35 


Lys 


Asp Leu 


Phe 


Thr 
40 


Arg 


Val 


Arg 


Gly 


Glu 
45 


Asn 


Val 


Phe 


Ser Pro Glu 
50 


Phe 


Gly Ala 


His 
55 


Met 


Val 


Arg 


Val 


Leu 
60 


Gly Gly Leu 


Asp 


Met Cys lie 
65 


Ala 


Leu Leu 
70 


Ser 


Asp 


Asp 


Thr 


Val 
75 


Leu 


Asn 


Ala 


Gin 


Leu 
80 


Ala His Leu 


Ser 


Thr Gin 
85 


His 


Lys 


Asp 


Arg 
90 


Gly 


He 


Pro 


Asn 


Glu 
95 


Tyr 


Phe Asp Val 


Val 
100 


Lys Val 


Ala 


Leu 


Met 
105 


Lys 


Val 


Val 


Pro 


Gly 
110 


His 


Val 



Ser His Phe Asp He Gly Ala Trp 
115 120 



<210> 19 

<211> 390 

<212> ADN 

<213> Arenicola marina 
<220> 

<221> CDS 

<222> (1)..(390) 

<223> 

<400> 19 

tgt tgc agt ata gag gac cgc aag gag gtc cag acg ctg tgg agt gag 4 8 

Cys Cys Ser He Glu Asp Arg Lys Glu Val Gin Thr Leu Trp Ser Glu 

15 10 15 



ate tgg agt gcc cag ttc act ggt cgc cgt gtc cag gtt gcc cag get 96 
He Trp Ser Ala Gin Phe Thr Gly Arg Arg Val Gin Val Ala Gin Ala 
20 25 30 

gtg ttc gag gac etc ttc cgc cgc gac ccc gag tec aag aac ctg ttc 144 
Val Phe Glu Asp Leu Phe Arg Arg Asp Pro Glu Ser Lys Asn Leu Phe 
35 40 45 
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aag cgc gtc aat gtt gac gac atg aac age ccc gaa ttc cac get cac 192 

Lys Arg Val Asn Val Asp Asp Met Asn Ser Pro Glu Phe His Ala His 
50 55 60 

tgc ate egt gtt gtc aac ggt ctt gac acc gtg ate ggt etc ett gac 240 

Cys lie Arg Val Val Asn Gly Leu Asp Thr Val lie Gly Leu Leu Asp 

65 70 75 80 

gac ccc gac acc ctg aag tec eag etc gag cac ttg gee eag cag cac 288 

Asp Pro Asp Thr Leu Lys Ser Gin Leu Glu His Leu Ala Gin Gin His 
85 90 95 

aag gag cgt gat ggc ate cac aag acc cac ttc gac gag atg tec cac- 336 

Lys Glu Arg Asp Gly lie His Lys Thr His Phe Asp Glu Met Ser His 

100 105 110 

gee ttc ggc gcc gtc atg ccc eag gtc age age tgt ttc aac ccc gat 384 

Ala Phe Gly Ala Val Met Pro Gin Val Ser Ser Cys Phe Asn Pro Asp 
115 120 125 

gea tga 390 
Ala 



<210> 20 

<211> 129 

<212> PRT 

<213> Arenieol 

<400> 20 

Cys Cys Ser lie 

1 

lie Trp Ser Ala 
20 



Val Phe Glu Asp 
35 

Lys Arg Val Asn 

50 

Cys lie Arg Val 
65 

Asp Pro Asp Thr 



Lys Glu Arg Asp 
100 

Ala Phe Gly Ala 
115 

Ala 



marina 



Glu Asp Arg Lys 
5 

Gin Phe Thr Gly 



Leu Phe Arg Arg 
40 



Val Asp Asp Met 

55 



Val Asn Gly Leu 
70 

Leu Lys Ser Gin 
85 

Gly lie His Lys 



Val Met Pro Gin 
120 



Glu Val Gin Thr 
10 

Arg Arg Val Gin 
25 

Asp Pro Glu Ser 



Asn Ser Pro Glu 

60 

Asp Thr Val lie 
75 

Leu Glu His Leu 
90 

Thr His Phe Asp 
105 

Val Ser Ser Cys 



Leu Trp Ser Glu 
15 

Val Ala Gin Ala 
30 

Lys Asn Leu Phe 
45 

Phe His Ala His 



Gly Leu Leu Asp 
80 

Ala Gin Gin His 
95 

Glu Met Ser His 
110 



Phe Asn Pro Asp 
125 



<210> 21 
<211> 20 
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<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PGR- 
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<220> 
<221> 
<222> 
<223> 



misc_f eature 
(9) . . (9) 
A, G, C ou T 



<220> 
<221> 
<222> 
<223> 



mi sc_f eature 
(12) . , (12) 
A, G, G ou T 



<400> 21 

gartgyggnc cnttrcarcg 



20 



<210> 22 

<211> 21 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PGR 

<400> 22 

ctcctctcct ctcctcttcc t 21 



<210> 23 

<211> 17 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PGR 

<220> 

<221> misc__f eature 

<222> (6) . . (6) 

<223> A, G, G ou T 

<220> 

<221> misc_feature 

<222> (12) . . (12) 

<223> A, G, G ou T 

<400> 23 

tgyggnathc tncarcg 17 



<210> 24 

<211> 18 

<212> ADN 

<213> artificial sequence 



<220> 

<223> amorce PGR 
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<220> 
<221> 
<222> 
<223> 



misc_f eature 
(6) . . (6) 
inosine 



<220> 
<221> 
<222> 
<223> 



mis cofeature 
{12) . . (12) 
A, G, C ou T 



<400> 24 

aargtnaarc anaactgg 



18 



<210> 25 

<211> 20 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PGR 



<400> 25 

tgytgyagya thgargaycg 



20 



<210> 26 

<211> 20 

<212> ADN 

<213> artificial sequence 

<220> 

<223> amorce PGR 



<220> 
<221> 
<222> 
<223> 

<220> 
<221> 
<222> 
<223> 



mi sc_f eature 
(6).. (6) 
A, G, C ou T 



misc_f eature 
(15) . . (15) 
A, G, C ou T 



<400> 26 

aargtnatht tyggnagrga 



20 



<210> 


27 


<211> 


20 


<212> 


ADN 


<213> 


artificial s 


<220> 




<223> 


amorce PGR 


<220> 




<221> 


misc feature 


<222> 


(15) (15) 


<223> 


A, G, G ou T 
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<220> 

<221> misc_feature 

<222> (18).. (18) 

<223> A, C ou T 

<400> 27 

garcaycart gyggnggnga 20 



<210> 28 

<211> 21 

<212> ADN 

<213> artificial sequence 

<220> 

<223> amorce PGR 
<220> 

<221> inisc_f eature 

<222> (4) . . (4) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (7) . . (7) 

<223> A, G, C ou T 



<400> 28 

ccangcntcy ttrtcraagc a 



<210> 
<211> 

<212> 
<213> 



29 
19 

ADN 

artificial 



sequence 



<220> 

<223> amorce PGR 
<220> 

<221> misc_f eature 

<222> (2) . . (2) 

<223> A, G, C ou T 



<220> 

<221> misc_f eature 

<222> (8) ,.(8) 

<223> A, G, C ou T 

<220> 

<221> misc_f eature 

<222> (11) . . (11) 

<223> A, G, C ou T 



<220> 

<221> misc_f eature 

<222> (14) . . (14) 

<223> A, G, C ou T 
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<400> 29 

antgyggncc nctncarcg 19 

<210> 30 

<211> 18 

<212> ADN 

<213> artificial sequence 



<220> 

<223> amorce PGR 



<220> 

<221> niisc_f eature 

<222> (4) . , (4) 

<223> A, C ou T 



<220> 

<221> misc_f eature 

<222> (7) , . (7) 

<223> A, G, C ou T 

<400> 30 

ccangcnccd atrtcraa 18 



<210> 31 

<211> 20 

<212> ADN 

<213> artificial sequence 
<220> 

<223> amorce PGR 



<220> 

<221> misc_feature 

<222> (3).. {3} 

<223> A, G, C ou T 

<220> 

<221> misc_feature 

<222> (6) . . (6) 

<223> A, G, C ou T 



<400> 31 

cangcnycrc trttraarca 



20 



